[发明专利]一种基于深度学习的弱监督目标定位方法在审
申请号: | 202010614514.1 | 申请日: | 2020-06-30 |
公开(公告)号: | CN111967464A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 赖睿;吴俣;徐昆然;李奕诗;官俊涛;杨银堂 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 李园园 |
地址: | 710000 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 监督 目标 定位 方法 | ||
本发明公开了一种基于深度学习的弱监督目标定位方法,包括:将待测图像输入至弱监督定位网络,得到目标定位图以及所述目标的分类结果;基于目标定位图和分类结果确定目标定位结果;弱监督定位网络包括:初始特征提取模块,用于从待测图像中提取初始特征图;注意力加权模块,用于对初始特征图进行加权;掩模模块,用于屏蔽注意力加权特征图中与目标相关的显著性区域得到注意力掩模图;特征融合模块,用于对初始特征图和注意力掩模图进行特征融合;去冗余连通域模块,用于去除融合特征图中的冗余连通域,输出目标定位图;分类结果输出模块用于输出目标的分类结果。本发明可以在确保定位任务的准确性的前提下保持目标细节。
技术领域
本发明属于计算机图像视觉处理技术领域,具体涉及一种基于深度学习的弱监督目标定位方法。
背景技术
在计算机图像视觉处理技术领域中,采用卷积神经网络提取高质量的定位图,可以帮助实现目标精细分类、目标检测、图像分割等多种任务。采用卷积神经网络提取定位图的方法大致可以包括强监督的目标定位方法和弱监督的目标定位方法两种。其中,采用强监督的目标定位方法需要在准备阶段标注所有训练图片中的目标的位置信息,会消耗大量的人工标注成本;由此,采用弱监督的目标定位方法逐渐受到关注。弱监督的目标定位技术旨在降低标注维度的前提下预测不同场景下的目标位置,即在网络训练过程中使用图像级类别标签替代强监督下的位置标注方式,降低数据标注难度。
现有的弱监督定位方法大多利用卷积神经网络从图像中提取热力图响应作为定位依据。然而,当目标尺度较大时,现有的弱监督定位方法存在局部响应的问题,即卷积神经网络趋向于关注目标具有鉴别性的区域,无法充分提取目标的细节、形态特征等有效的特征信息,从而无法在确保定位任务的准确性的前提下保持目标细节。
发明内容
为了在确保定位任务的准确性的前提下保持目标细节,本发明提供了一种基于深度学习的弱监督目标定位方法。
本发明要解决的技术问题通过以下技术方案实现:
第一方面,本发明提供了一种基于深度学习的弱监督目标定位方法,包括:
获取待测图像;所述待测图像中包含有待定位的目标;
将所述待测图像输入至预先训练完成的弱监督定位网络,得到所述待测图像对应的目标定位图以及所述目标的分类结果;
基于所述目标定位图和所述分类结果,确定目标定位结果;
其中,所述弱监督定位网络是基于多个训练图像以及每个训练图像的分类标签所训练获得的;所述弱监督定位网络包括:
初始特征提取模块,包括多个级联的第一卷积单元和第二卷积单元,用于通过所述多个级联的第一卷积单元和第二卷积单元从所述待测图像中提取初始特征图;其中,每个所述第一卷积单元均包括级联的多个卷积层和一个最大池化层,每个所述第二卷积单元均包括级联的多个卷积层,且不包括最大池化层,任一所述第二卷积单元包括的多个卷积层为具有不同膨胀率的空洞卷积层;
注意力加权模块,用于基于所述初始特征图计算一注意力权重矩阵,并利用所述注意力权重矩阵对所述初始特征图进行加权,得到注意力加权特征图;其中,所述注意力权重矩阵用于表征所述初始特征图的通道间的空间相似度;
掩模模块,用于屏蔽所述注意力加权特征图中与所述目标相关的显著性区域,得到注意力掩模图;
特征融合模块,用于对所述初始特征图和所述注意力掩模图进行特征融合,得到融合特征图;
去冗余连通域模块,用于去除所述融合特征图中的冗余连通域,输出所述待测图像对应的目标定位图;其中,所述冗余连通域为与所述目标非相关的像素连通区域;
分类结果输出模块,用于基于所述目标定位图,确定并输出所述目标的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010614514.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种混凝土水泥浆回收装置
- 下一篇:一种网络违规外联场景的分析识别方法