[发明专利]基于多尺度特征融合的自适应可变占比目标检测方法在审
申请号: | 202110712902.8 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113313118A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 宿南;李瑞;王金鹏;闫奕名;赵春晖;黄博闻 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 岳泉清 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 特征 融合 自适应 可变 目标 检测 方法 | ||
基于多尺度特征融合的自适应可变占比目标检测方法,属于目标检测技术领域,本发明为解决待测目标是小目标情况下,小目标在特征图上尺寸过小,学习过程中易被大目标主导,导致小目标检测效果较差的问题。它包括:可变占比图像生成器将原始数据生成不同大小的目标数据,然后将目标数据输送至特征提取网络,特征提取网络对特征进行提取,然后将提取的特征输送至多尺度特征生成器,多尺度特征生成器产生三个尺度的特征图,所述三个尺度特征图包括小特征图、中特征图和大特征图,将三个尺度的特征图输送至多尺度预测框中,多尺度预测框对三个尺度的特征图分别生成预测框,预测框内即为目标检测结果。本发明用于目标检测,尤其适用于小目标的目标检测。
技术领域
本发明涉及一种自适应可变占比目标检测方法,属于目标检测技术领域。
背景技术
目标检测也称为目标提取,是在图像中定位并分类出感兴趣的目标的方法。在实际应用环境中,由于相机成像存在远小近大的特点,因此,当出现场景较为复杂、待检测目标尺度大小差异较大、待检测目标为小目标等问题时,现有的算法很难满足实际需要。
针对待检测目标为小目标的情况,由于小目标在图像中尺寸比较小,在通用目标检测模型中,一般的基础骨干神经网都有下采样过程,导致原本较小的目标在特征图上的尺寸更加小,这会导致设计的分类器的效果较差,另外由于小目标特征的感受野映射回原图将可能远远大于实际尺寸,造成检测效果差。此外,由于实际的数据中可能存在小目标样本较少,导致神经网络在学习的过程中被大目标主导,导致小目标的检测效果很差。
发明内容
本发明目的是为了解决待测目标是小目标的情况下,小目标在特征图上的尺寸过小,以及学习过程中易被大目标主导,导致小目标的检测效果较差的问题,提供了一种基于多尺度特征融合的自适应可变占比目标检测方法。
本发明所述基于多尺度特征融合的自适应可变占比目标检测方法,它基于Yolo算法框架实现;该目标检测方法包括:
可变占比图像生成器、特征提取网络、多尺度特征生成器和多尺度预测框;
可变占比图像生成器将原始数据生成不同大小的目标数据,然后将不同大小的目标数据输送至特征提取网络,特征提取网络对特征进行提取,然后将提取的特征输送至多尺度特征生成器,多尺度特征生成器产生三个尺度的特征图,所述三个尺度特征图包括小特征图、中特征图和大特征图,将三个尺度的特征图输送至多尺度预测框中,多尺度预测框对三个尺度的特征图分别生成预测框,预测框内即为目标检测结果。
优选的,可变占比图像生成器输入的原始数据为:
Fimgin(x,y)|0<x,y<t;
将原始数据平移得到:Fimgin(x,y)|t1<x,y<t+t1;
其中,t1表示填充的黑色边带的宽度,受多尺度损失反馈调节,填充后的图片函数为:
Fimgout(x,y)|υ=0<x,y<t+2*t1=Fimgin(x,y)|ω=t1<x,y<t+t1+(0,0,0)|υ-ω;
其中,(0,0,0)|α为在α区域填充黑色;α表示以距离原图像t1的直线为边界的内侧区域,ω表示填充前的定义域边界,υ表示填充后的定义域边界,
输出的目标数据为:
Fout(x,y)0<x,y<t=Fimgout(x/[(t+2*t1)/t],y/[(t+2*t1)/t])|υ=0<x<t+2*t1;
(x,y)表示二维平面上点的位置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110712902.8/2.html,转载请声明来源钻瓜专利网。