[发明专利]一种利用特征图融合的目标检测方法有效
申请号: | 201810843493.3 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109034245B | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 张世辉;王红蕾;桑榆;何欢 | 申请(专利权)人: | 燕山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04 |
代理公司: | 北京挺立专利事务所(普通合伙) 11265 | 代理人: | 刘阳 |
地址: | 066004 河北省*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 特征 融合 目标 检测 方法 | ||
1.一种利用特征图融合的目标检测方法,其特征在于,包括如下步骤:
步骤S1:利用ZF网络提取图像特征并得到特征图;
所述步骤S1包括以下步骤:
步骤S101:对输入图像进行归一化处理,使图像的大小均为224×224像素;
步骤S102:利用ZF网络提取归一化后的图像特征并得到一系列处于不同层次的特征图;
步骤S2:对所得特征图进行特征图融合并得到新特征图;
所述步骤S2包括以下步骤:
步骤S201:根据特征图融合思想选取ZF网络提取的第3层和第4层浅层特征图Conv3和Conv4;
步骤S202:利用1×1的卷积核对浅层特征图Conv3和Conv4进行降维,且降维到特征图Conv5的大小;
步骤S203:将降维后的特征图Conv3和Conv4与特征图Conv5中进行融合得到新特征图;
所述步骤S202中对浅层特征图Conv3和Conv4进行降维的计算公式如下:
GConvi(m,n,d)=f(gConvi(m,n,k)*δConvi(1,1,k)+b)
其中,参数m、n分别表示特征图的长和宽,k和d和分别表示浅层特征图降维前的通道数和浅层特征图降维后的通道数,gConvi(m,n,k)表示浅层特征图Convi且i的取值为3或4,GConvi(m,n,d)表示gConvi(m,n,k)降维后的特征图,δConvi(1,1,k)表示得到的GConvi(m,n,d)时所需的1×1的卷积核,b表示得到GConvi(m,n,d)时所需的标量参数,*表示卷积,f()表示激活函数;
所述步骤S203中将降维后的特征图Conv3和Conv4与特征图Conv5中进行融合的计算公式如下:
Fnew(m,n,d)=∑λiGConvi(m,n,d)+γgConv5(m,n,d)
其中,常量参数λi和γ分别表示特征图融合时浅层特征图和最深层特征图的权值,Fnew(m,n,d)表示新特征图,gConv5(m,n,d)表示特征图Conv5;
步骤S3:通过RPN网络获取区域建议;
步骤S4:把新特征图和区域建议输入到后续网络层中得到目标检测结果。
2.根据权利要求1所述的目标检测方法,其特征在于,所述步骤S201包括以下步骤:
步骤S2011:根据卷积神经网络提取的不同层次的特征图具有的不同特点,总结出将浅层特征图降维后和最深层特征图进行融合得到新特征图;
步骤S2012:根据特征图融合及ZF网络的结构、卷积层数及各层次特征图需要降维的具体情况,确定选取ZF网络中第3层和第4层卷积层产生的特征图Conv3和Conv4。
3.根据权利要求1所述的目标检测方法,其特征在于,所述步骤S3包括以下步骤:
步骤S301:将新特征图输入到RPN网络中得到候选窗口,其过程如下:利用3×3的卷积核在输入的新特征图上滑动,并在3×3的卷积核滑过的每个位置处都生成12种候选窗口,其中包括3种长宽比例{1:1,1:2,2:1}和4种面积种类{64×64,128×128,256×256,512×512},卷积核滑过新特征图的所有位置后得到所有的候选窗口;
步骤S302:利用Softmax层从中选取包含目标的候选窗口,其过程如下:Softmax层是一种具有多分类功能的卷积神经网络层,将候选窗口分成包含目标的候选窗口和不包含目标的候选窗口,且Softmax层为每一个包含目标的候选窗口生成一个分数,根据该分数选取候选窗口;
步骤S303:通过非极大值抑制对包含目标的候选窗口进行再次筛选,并将筛选出的候选窗口作为RPN网络的输出,得到区域建议。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于燕山大学,未经燕山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810843493.3/1.html,转载请声明来源钻瓜专利网。