[发明专利]一种基于无监督物体检测消除偏差的网络数据学习方法在审

专利信息
申请号: 201910358543.3 申请日: 2019-04-30
公开(公告)号: CN110135480A 公开(公告)日: 2019-08-16
发明(设计)人: 杨巨峰;孙晓晓;陈丽怡 申请(专利权)人: 南开大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 天津耀达律师事务所 12223 代理人: 侯力
地址: 300350 天津*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 网络图像 物体检测 无监督 卷积神经网络 标准数据 候选区域 内容区域 网络模型 网络数据 边界框 图像 对象区域 目标物体 数据不足 图像分类 先验知识 学习训练 训练数据 小尺度 新图像 再使用 学习 应用 弱化 标签
【说明书】:

一种基于无监督物体检测消除偏差的网络数据学习方法。该方法的目的是弱化网络图像与标准数据集之间的构造偏差,从网络图像中学习并应用于卷积神经网络训练中,即通过无监督物体检测的方法在训练数据中加入处理后的网络图像来解决深度学习训练中数据不足的问题。本发明首先根据先验知识生成第一种弱边界框作为输入数据训练第一个候选区域生成网络模型RPN,获得包含目标物体的内容区域图像;再使用更小尺度的第二种弱边界框来训练第二个候选区域生成网络模型,得到内容区域图像上的对象区域,而后设置形式约束和标签约束来消除偏差,选择出相对于标准数据集无偏差的区域作为新图像用于训练卷积神经网络,最终应用于图像分类任务中。

技术领域

本发明属于计算机视觉技术领域,涉及到一种消除网络图像偏差用于训练卷积神经网络的方法,更具体地,涉及一种基于无监督物体检测消除偏差的网络数据学习方法。

背景技术

近年来,深度学习的迅速发展对计算机视觉领域中很多经典问题的解决起到了巨大的推动作用,如图片检索、显著性区域检测、物体检测、物体识别等。而训练卷积神经网络需要依赖大量带有标签的数据,使用人工标注是非常费时费力的。对于需要专业知识标注的数据,人工标注更为困难。近几年,为了解决训练卷积神经网络时面临的数据不足问题,大量的网络图像引起越来越多的研究人员的关注。网络上的图像是容易获取且数量庞大并不断增长的,使用这些图像训练卷积神经网络可以有效地减少人工标注数据的代价。但是在以往的工作中,由于网络图像带有噪声,利用网络数据训练卷积神经网络获得的性能提升是非常有限的。

S.E.Reed等人在文献1中证明使用网络数据训练深度网络模型可以提升模型的性能。此外,文献2中提出了一种两阶段的方法,该方法利用噪声网络数据和卷积神经网络的可迁移性进行学习。这项工作假设标签的噪声独立于图像,这就导致模型性能将会受到人工定义的噪声标签的影响。2015年,T.Xiao等人在文献3中使用概率框架来处理噪声标签,并在端到端学习过程中训练分类器,使模型对于噪声数据具有一定的鲁棒性。然而,目前包括标签过滤方法在内的使用网络数据训练卷积神经网络的方法,均没有对分类效果进行明显改善。其主要原因在于网络数据和目标任务的标准数据集之间存在数据偏差。

网络图像的内容相比标准数据集来说更为复杂、凌乱,这使得网络数据集与标准数据集之间的数据分布存在着差异,来自于两种数据集的图像很可能是完全无关的。在细分类任务中,大多数标准数据集图像中的物体通常处于图像的中央位置并且尺寸适宜,而网络图像往往存在目标物体太小、位置处于角落、图像内容和标签不对应等问题。这些因素造成网络图像与标准数据集之间存在构造偏差,从而影响利用网络数据辅助图像分类的效果。因此,使用网络图像训练卷积神经网络仍具有很大的挑战。

参考文献:

文献1:Reed S E,Lee H,Anguelov D,et al.Training Deep Neural Networkson Noisy Labels with Bootstrapping.CoRR,2014,abs/1412.6596.

文献2:Chen X,GuptaA.Webly supervised learning ofconvolutionalnetworks.In:ICCV,2015.

文献3:Xiao T,Xia T,Yang Y,et al.Learning from massive noisy labeleddata for image classification.In:ICCV,2015.

发明内容

本发明的目的是从容易获得的、大规模的网络图像中学习,用以解决卷积神经网络训练过程中面临的数据较少的问题。相比现有技术仅对噪声图片进行剔除而忽略了网络图像与标准数据集之间的偏差,本发明提出一个基于无监督的物体检测消除偏差的网络数据学习方法,进一步解决网络图像与标准数据集之间存在的偏差问题。该发明可以过滤噪声数据、消除网络数据与标准数据集之间的偏差,利用消除偏差后的网络图像来训练深度模型,从网络数据中学习知识。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910358543.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top