[发明专利]一种基于信息增强与感受野增强的小目标检测方法有效
申请号: | 202111119578.5 | 申请日: | 2021-09-24 |
公开(公告)号: | CN113837080B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 王佩;罗会兰 | 申请(专利权)人: | 江西理工大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/80;G06V10/42;G06V10/44;G06V10/52;G06N3/0464;G06N3/08;G06V10/764;G06V10/766 |
代理公司: | 温州知远专利代理事务所(特殊普通合伙) 33262 | 代理人: | 汤时达 |
地址: | 341000 *** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 信息 增强 感受 目标 检测 方法 | ||
本发明公开了一种基于信息增强与感受野增强的小目标检测方法,旨在提高小目标的检测精度。本发明设计了两个模块来增强小目标的信息,其具体方法如下:首先为了获得输入特征的全局信息,局部信息和多尺度信息,设计了信息增强模块;其次设计了感受野增强模块,利用扩张卷积获得不同尺度感受野的特征并将其进行密集连接,从而获得具有判别性的特征;然后输入特征分别使用这两个模块进行信息增强,得到增强后的特征图;最后在得到增强后的特征图基础上进行下采样,共获得6个不同尺度的特征图,分别对这6个不同尺度的特征图进行目标检测,得到最终的检测结果。在数据集上的实验结果表明本发明算法对检测小目标具有较高的检测精度。
技术领域
本发明属于计算机视觉领域,涉及对目标检测模型的改进、图像目标检测与仿真实现。
背景技术
目标检测作为计算机视觉的基本任务之一,它的主要任务是从输入图像中定位出感兴趣的目标并判断出每个目标所属的类别,目前已在多种场景中得到应用,如目标跟踪、智能监控和自动驾驶等领域。近年来,随着深度学习的不断发展,小目标检测研究得到广泛关注,被应用于城市智慧交通、物流管理、农林业发展、公共安全和抗灾救灾部署等任务场景中。但小目标在原图中所包含的像素数少,携带的信息有限,在深度网络中经过多次下采样后,分辨率进一步降低,造成特征信息减弱甚至丢失,同时不同尺度的特征图没有进行有效融合,未能建立信息间的传递与交流,从而造成检测难度增大,因此小目标检测仍是计算机视觉任务中一个亟待解决的难点。
由于目前专门针对小目标检测的算法研究较少,直接使用通用目标检测方法容易造成小目标错检漏检,效果不好。为此本发明设计了两个模块来增强小目标的信息,其具体方法如下:首先为了获得输入特征的全局信息,局部信息和多尺度信息,设计了信息增强模块;其次设计了感受野增强模块,利用扩张卷积获得不同尺度感受野的特征并将其进行密集连接,从而获得具有判别性的、融合了不同抽象级别信息的特征;然后输入特征分别使用这两个模块进行信息增强,得到增强后的特征图;最后在得到增强后的特征图基础上进行下采样,共获得6个不同尺度的特征图,分别对这6个不同尺度的特征图进行目标检测,得到最终的检测结果。
发明内容
1.发明目的:
本发明的目的是提出基于信息增强与感受野增强的小目标检测方法。
2.技术方案:
本发明提出一种基于信息增强与感受野增强的小目标检测方法,该网络能够建立并增强信息之间的交流与联系,产生更具判别性的特征。首先,本发明为了有助于定位小目标,对骨干网络提取到的浅层特征进行重复利用,将VGG-16网络中的低层特征与高层特征分别上采样和下采样至相同的尺度大小,然后将其在通道维度上进行拼接,获得含纹理信息和语义信息的多尺度特征图。其次,本发明提出了信息增强模块,此模块设计了全局信息分支、局部信息分支和多尺度语义信息分支,通过对输入特征的全局信息、局部信息和多尺度语义信息进行学习,获得富含小目标上下文信息的增强特征。然后,为减少小目标信息的丢失,本发明设计了感受野增强模块,利用不同扩张率的扩张卷积获得不同尺度感受野的特征,然后将其进行拼接融合。值得注意的是,本发明在获得不同尺度感受野特征时采用了密集连接,从而为不同尺度间的感受野特征建立了联系。最后,本发明在得到增强后的特征图基础上,进行下采样,共获得6个不同尺度的特征图,分别对这6个不同尺度的特征图进行目标检测,得到最终的检测结果。考虑到不同尺寸的特征图包含的细节信息不一致,本发明分别对300×300和512×512两种尺寸的输入图像进行了训练和测试,从而得到一个更具鲁棒性的模型。
本发明所述的一种基于信息增强与感受野增强的小目标检测方法,包括以下步骤:
步骤(1):在骨干特征提取网络VGG-16的基础上,将低层特征与高层特征分别上采样和下采样至相同的尺度大小,然后将其在通道维度上进行拼接,获得含纹理信息和语义信息的多尺度特征图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江西理工大学,未经江西理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111119578.5/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置