导航菜单
本文 ReLabel 标注器的恶果对照原始 ImageNet 标签(左上)与。 abel 的恶果为了验证 ReL,的多标签评估目标)实行 ImageNet 分类工作讨论者应用分别的汇集架构和评估目标(搜罗近期提出。mageNet-1K 基准上评估 ReLabel 计谋他们正在蕴涵 128 万演练图像和 5 万验证图像的 I。有模子关于所,准数据加强技能他们均应用标,翻转、颜色颤动如随机剪裁、。 ImageNet图片:多标签原题目:《从新标注128万张,模子机能周到提拔》 abelling)计谋 ReLabel这项讨论提出了一种从新标注(re-l,演练集上得回像素级真值标签以正在 ImageNet 。拥有两个特性:多种别标签和片面标签标签映照((label map))。e annotator)得回标签映照讨论者应用机械标注器(machin,练的 SOTA 图像分类器该标注器是正在特别源数据上训。何得回标签映照讨论者先容了如, LabelPooling并提出了一个簇新的演练框架,标签演练图像分类器以应用这类片面多。 社区最时髦的图像分类基准数据集ImageNet 是机械研习,0 万张标注图像蕴涵横跨 140。等人于 2006 年起先创筑该数据集由斯坦福教养李飞飞,下游视觉工作中才干的试金石后成为评估估计机视觉模子正在。 syncedai5)增加机械之心幼帮手(,AAI」备注「A,起看直播进群一。 NN 和 Mask-RCNN 行动主意检测和实例朋分工作的 base 模子主意检测与实例朋分:讨论者离别使东西备特性金字塔汇集的 Faster-RC。 ReLabel 预演练的 ResNet-50 模子举办初始化Faster-RCNN 和 Mask-RCNN 的主干汇集基于,COCO 数据集进步行微调然后应用原始演练计谋正在 。见下表 9实行结果参: 表此,eNet 演练集、预演练权重和源代码讨论者还开源了从新标注的 Imag。 括 ResNet-18、ResNet101、EfficientNet-{B0正在分别汇集架构上的结果:讨论者应用 ReLabel 演练了多个分别架构(包,1B,2B,eXNet)B3}、乐天堂fun88备用网址,R,于具备分别演练机造的多种汇集声明 ReLabel 可用。示了实行结果下表 4 展,以看出从中可,提拔分别汇集架构的机能ReLabel 接连,的精确率从 81.7% 提拔至 82.5%比如将 EfficientNet-B3 。 ∈ R^W×H×C 之后正在得回上述蚁集多标签 L,使用它们演练分类器接下来需求商讨怎么。此对,案 LabelPooling讨论者提出了一种簇新的演练方,g 和原始 ImageNet 演练之间的区别它将片面线 显现了 LabelPoolin: sion-Language Representations Through Scene Graph》中正在百度被AAAI 2021采纳的论文《ERNIE-ViL: Knowledge Enhanced Vi,加强的视觉-讲话预演练技能讨论者们提出了一种基于常识,筑了场景图预测工作基于场景图常识构,度语义对齐的笼络透露从而研习到描写细粒,态类型工作上赢得了 SOTA 恶果正在视觉问答、视觉常识推理等五个多模,VCR 榜单的第一名并赢得视觉常识推理 。 Net 并不完整然而 Image,正在洪量噪声其标签存。讨论声明近期多项,样本蕴涵多个种别该数据荟萃很多,身是一个单标签基准数据集而 ImageNet 本。et 转换为多标签工作评估基准少少讨论者提出将 ImageN,于标注本钱过高然则不妨是由,修复演练集他们并未。 eLabel 和机械天生的标签舆图后下表 10 显现了实行结果:应用 R,mAP 离别延长了 3.7 pp 和 2.4 ppResNet-50 和 ResNet-101 的 ;le 标签舆图后应用 orac,4.2 pp 和 4.3 pp二者的 mAP 离别延长了 。 布从此自愿,机械研习社区最时髦的图像分类基准ImageNet 数据集渐渐成为, 本身存正在着标签噪声但 ImageNet,多种别样本之间的不立室以及单标签标注属性与。本文中以是正在,新标注计谋以及一个基于特别源数据的强健图像分类器韩国 Naver AI 实行室提出了一种簇新的重,t 等多种架构都杀青了机能提拔通过该计谋演练的 ResNe。 上分享 基于常识加强AAAI 2021线,NIE-ViL赢得多项工作SOT百度新型视觉-讲话预演练模子ERA 剪裁行动数据加强形式多标签演练常用随机,景况下正在这种,ling 可能供应特别的片面监视信号ReLabel 和 LabelPoo,多标签演练集帮帮改观原始。据集 COCO 举办实行讨论者应用多标签分类数,lPooling 演练多标签分类器然后应用基于标签映照的 Labe。 20:001月28日,级研发工程师唐尼为大多周到解读此讨论论文共统一作、百度天然讲话打点部高。 现最优机能的其他演练技术起到填补感化SOTA 机能:ReLabel 对实,与 ReLabel 连接起来比如将 CutMix 正则化。上实行 CutMix讨论者正在随机剪裁图像, 算法将池化标签举办羼杂然后凭据 CutMix。esNet-50 和 ResNet-101 行动主干模子的景况下实行结果参见下表 5:ReLabel + CutMix 正在以 R,eNet top-1 精确率均赢得了 SOTA Imag。 细心到讨论者,标签监视(softmax 交叉熵吃亏)举办演练即使机械标注器正在 ImageNet 上应用单,种别图像举办多标签预测但它们已经偏向于对多。以所,正在洪量的标签噪声假设数据荟萃存,的模子偏向于预测多标签输出则使用单标签交叉熵吃亏演练。 ageNet 机能校正能否迁徙至分别的下游工作讨论者还搜检了 ReLabel 带来的 Im,主意检测与实例朋分工作上的结果显现了正在五个细粒度分类工作、。 中得回蚁集真值标签讨论者从机械标注器,测不妨亲昵于人类预测从这类模子中得回的预。并正在 GPU 或 TPU 上演练数百天因为演练机械标注器需求拜望专有演练数据,练权重行动机械标注器以是讨论者采用开源训。 此为,从新标注:他们正在特别的数据源上演练了一个强健的图像分类器这些讨论者决断应用多标签对 ImageNet 演练集举办,成多标签应用其生,注本钱题目管理了标;用像素级多标签预测正在最终池化层之前使,地位特定监视信号以填塞使用特别的。 Net 演练树立下正在法式 Image,于每张图像的单标签真值随机剪裁的监视信号来自。方面另一, 会加载估计算的标签映照LabelPooling,裁坐标相对应的区域池化操作并正在标签映照上实行与随机剪。lign 区域池化法子讨论者采用了 RoIA。 的一篇论文中正在不日发表,I LAB 的讨论者以为来自韩国 NAVER A,裁的演练树立下正在操纵了随机剪,之间的不立室带来了平等题目单标签标注和高效多标签图像。标签标注时正在应用单,与真值齐备分别的对象图像随机剪裁不妨蕴涵,至不精确的监视信号为演练带来噪声甚。 表此,个好处:提取地位特定的标签使用分类器获取标签又有一。器的全体均匀池化层讨论者移除了分类,线 的卷积层并将接下来的,化为一个全卷积汇集从而将该分类器转。后然,) ∈ R^W×H×C模子的输出成为 f(x。签映照标注 L ∈ R^W×H×C讨论者将该输出 f(x) 行动标。 练可能周到提拔模子机能基于从新标注样本的训。如例,的片面多标签后应用该讨论提出,上的 top-1 分类精确率到达 78.9%ResNet-50 正在 ImageNet ,还可能进一步提拔至 80.2%应用 CutMix 正则化后。声明实行,检测和实例朋分工作以及多种保守性基准时应用片面多标签演练的模子正在迁徙至主意,基线法子机能优于。 l 与之前那些直接安排 ImageNet 标签的法子与其他标签驾御法子的对照:讨论者对照了 ReLabe,ResNet50应用的模子是 。下表 3结果参见: 表此,均池化和 softmax 操作讨论者正在池化预测图上实行全体平,签真值向量以得回多标。后最,了交叉熵吃亏讨论者应用。 ircraft 和 Oxford Pets)上评估了应用 ReLabel 预演练的 ResNet-50 的机能细粒度分类工作:讨论者正在五个细粒度分类工作(Food-101、Stanford Cars、DTD、FGVC A。见下表 8实行结果参:
图片