[发明专利]一种基于通道选择的对抗消除弱监督目标检测方法有效
申请号: | 201910838283.X | 申请日: | 2019-09-05 |
公开(公告)号: | CN110569901B | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 杨金福;单义;李明爱;武随烁 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06V10/25;G06N3/04;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通道 选择 对抗 消除 监督 目标 检测 方法 | ||
本发明涉及一种基于特征通道选择的对抗消除弱监督目标检测方法,用于解决弱监督目标检测定位误差的问题。首先,以弱监督深度目标检测为底层框架,采用选择性搜索方法在训练集数据上生成候选框,并与训练集图像和对应的图像标签一起作为弱监督网络的输入;其次,以VGG16为基础网络构建特征提取网络模型,并对得到的特征图像用特征通道压缩的方式进行通道加权选择,激励有利于分类的图像特征层,而抑制对分类有干扰的特征层;然后,采用对抗消除方法得到能够表达图像目标的完整特征表达作为预测网络的输入;最后,根据多任务交叉熵损失来训练预测网络,实现目标检测。本发明不仅可以更加精确定位目标物体的位置,而且能够提高物体识别的精度。
技术领域
本发明属于目标检测技术领域,介绍了一种基于对抗消除的弱监督目标检测方法。
背景技术
随着科技的发展和人类生活智能化水平的提高,移动机器人逐渐进入到人类生产生活中,并且被广泛地应用到了各个行业。基于移动机器人的目标检测在巡检、安防、视频监控搜索等领域获得了广泛的应用。现阶段的深度学习目标检测算法一般需要大量人工标注的数据集,不仅浪费大量的人力、物力、财力,而且错误标注的数据还会影响模型的鲁棒性和模型的检测精度。而基于弱监督的目标检测算法只需要图像级别的标签就可以完成目标检测,所以更加适用于工业生产应用环境中。
近年来,基于深度学习目标检测算法获得了长足的发展。基于图像级别的标签实现深度学习目标检测的方法也得到了快速的发展。 2016年,Bilen[1]等人首次提出将深度学习应用于图像级别标签的目标检测算法中,相比于传统的弱监督目标检测算法,在公共数据集上的检测精度有了明显的提高。2016年,Diba[2]等人提出级联的深度学习弱监督目标检测算法。该模型分为两步:(1)级联网络的第一段为基础的卷积神经网络,用于提取可能存在目标物体的候选区域;(2) 把级联网络第一段输出的候选区域作为第二段网络的输入,最后通过多示例学习方法检测目标物体。2017年,Tang[3]等人提出一种多示例循环迭代的深度学习目标检测网络。该网络针对在目标检测框的预测阶段,经过非极大值抑制策略(NMS)之后,存在将分类得分较低、但定位准确的检测框抑制,而将目标预测分类得分高的物体、但定位较差的目标保留的问题,提出一种循环迭代的方法,逐步迭代更新物体的分类置信度以及检测框的位置。2018年,wang[4]等人提出协同学习的弱监督目标检测方法,通过将强监督学习网络与弱监督学习网络相结合的方式来提高检测的精度。将弱监督目标检测网络得到的检测框作为强监督学习网络的初始化输入,利用共享卷积网络来减少网络参数,并通过不断的循环训练更新强监督网络的输入以提高最终的精度。但是上述网络都需通过在网络模型的输入端不断更新调整检测框的位置,由于弱监督目标检测相较于强监督网络缺少位置回归,所以通过不断地迭代更新并不能完全解决弱监督目标检测中目标定位误差大的问题。
上述弱监督目标检测的优化方法都是在得到目标的特征图后对预测的候选框进行迭代的方法来优化目标检测框的位置。但是弱监督目标检测由于缺乏目标的准确位置标签信息,只通过迭代优化并不很好的解决目标检测框定位不准确的问题。
参考文献:
1.H.Bilen and A.Vedaldi.Weakly supervised deep detection networks. InProc.IEEE Int.Conf.Vis.Pattern Recognition.(CVPR),Pages 2846-2854,2016.
2.A.Diba,V.Sharma,A.Pazandeh,H.Pirsiavash,and L.Van Gool. Weaklysupervised cascaded convolutional networks.In Proc.IEEEInt.Conf.Computer.Vis.Pattern Recognition.(CVPR),pages 5131-5139,2017.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910838283.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:游戏AI决策方法及装置
- 下一篇:一种对对象基于区间数的基本概率分配生成方法