[发明专利]基于多尺度特征融合的自适应可变占比目标检测方法在审
申请号: | 202110712902.8 | 申请日: | 2021-06-25 |
公开(公告)号: | CN113313118A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 宿南;李瑞;王金鹏;闫奕名;赵春晖;黄博闻 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 岳泉清 |
地址: | 150001 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 尺度 特征 融合 自适应 可变 目标 检测 方法 | ||
1.基于多尺度特征融合的自适应可变占比目标检测方法,其特征在于,它基于Yolo算法框架实现;该目标检测方法包括:
可变占比图像生成器、特征提取网络、多尺度特征生成器和多尺度预测框;
可变占比图像生成器将原始数据生成不同大小的目标数据,然后将不同大小的目标数据输送至特征提取网络,特征提取网络对特征进行提取,然后将提取的特征输送至多尺度特征生成器,多尺度特征生成器产生三个尺度的特征图,所述三个尺度特征图包括小特征图、中特征图和大特征图,将三个尺度的特征图输送至多尺度预测框中,多尺度预测框对三个尺度的特征图分别生成预测框,预测框内即为目标检测结果。
2.根据权利要求1所述的基于多尺度特征融合的自适应可变占比目标检测方法,其特征在于,可变占比图像生成器输入的原始数据为:
Fimgin(x,y)|0<x,y<t;
将原始数据平移得到:Fimgin(x,y)|t1<x,y<t+t1;
其中,t1表示填充的黑色边带的宽度,受多尺度损失反馈调节,填充后的图片函数为:
Fimgout(x,y)|υ=0<x,y<t+2*t1=Fimgin(x,y)|ω=t1<x,y<t+t1+(0,0,0)|υ-ω;
其中,(0,0,0)|α为在α区域填充黑色;α表示以距离原图像t1的直线为边界的内侧区域,ω表示填充前的定义域边界,υ表示填充后的定义域边界,
输出的目标数据为:
Fout(x,y)0<x,y<t=Fimgout(x/[(t+2*t1)/t],y/[(t+2*t1)/t])|υ=0<x<t+2*t1;
(x,y)表示二维平面上点的位置。
3.根据权利要求2所述的基于多尺度特征融合的自适应可变占比目标检测方法,其特征在于,可变占比图像生成器输出的目标数据是将输入数据缩小到原来的倍。
4.根据权利要求3所述的基于多尺度特征融合的自适应可变占比目标检测方法,其特征在于,该目标检测方法还包括:损失函数计算模块和多尺度损失判别器;
损失函数计算模块分别对三个尺度的特征图计算损失函数,多尺度损失判别器根据损失函数的大小调节可变占比图像生成器的填充区域,当小特征图无法获得目标检测结果时,增大t1,使得可变占比图像生成器输出的目标数据是将输入数据缩小到原来的倍。
5.根据权利要求2所述的基于多尺度特征融合的自适应可变占比目标检测方法,其特征在于,特征提取网络包括五个残差单元;
可变占比图像生成器的输出数据Fout(x,y)0<x,y<t经过五个残差单元的五次下采样运算获取小特征图预测所需的特征图f1;
f1经过多尺度池化层和上采样,然后与中浅特征层四次下采样的结果进行拼接,获得中特征图预测所需的特征图f2;
f2经过多尺度池化层和上采样,然后与浅特征层四次下采样的结果进行拼接,获得大特征图预测所需的特征图f3。
6.根据权利要求5所述的基于多尺度特征融合的自适应可变占比目标检测方法,其特征在于,所述多尺度特征生成器产生三个尺度特征图的具体方法包括:
将提取的特征经过多尺度特征池化模块,捕捉不同尺度的特征,然后将不同尺度的特征经过多尺度特征融合;
多尺度特征包括:
将大特征图预测所需的特征图f3的特征经过下采样后与中特征图预测所需的特征图f2进行融合,获得中特征图,
将中特征图预测所需的特征图f2的特征经过下采样后与小特征图预测所需的特征图f1进行融合,获得小特征图,
大特征图预测所需的特征图f3的特征不变,获得大特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110712902.8/1.html,转载请声明来源钻瓜专利网。