[发明专利]一种利用特征图融合的目标检测方法有效

申请号：	201810843493.3	申请日：	2018-07-27
公开（公告）号：	CN109034245B	公开（公告）日：	2021-02-05
发明（设计）人：	张世辉;王红蕾;桑榆;何欢	申请（专利权）人：	燕山大学
主分类号：	G06K9/62	分类号：	G06K9/62;G06N3/04
代理公司：	北京挺立专利事务所(普通合伙) 11265	代理人：	刘阳
地址：	066004 河北省***	国省代码：	河北;13
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种利用特征融合目标检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种利用特征图融合的目标检测方法，其特征在于，包括如下步骤：

步骤S1：利用ZF网络提取图像特征并得到特征图；

所述步骤S1包括以下步骤：

步骤S101：对输入图像进行归一化处理，使图像的大小均为224×224像素；

步骤S102：利用ZF网络提取归一化后的图像特征并得到一系列处于不同层次的特征图；

步骤S2：对所得特征图进行特征图融合并得到新特征图；

所述步骤S2包括以下步骤：

步骤S201：根据特征图融合思想选取ZF网络提取的第3层和第4层浅层特征图Conv3和Conv4；

步骤S202：利用1×1的卷积核对浅层特征图Conv3和Conv4进行降维，且降维到特征图Conv5的大小；

步骤S203：将降维后的特征图Conv3和Conv4与特征图Conv5中进行融合得到新特征图；

所述步骤S202中对浅层特征图Conv3和Conv4进行降维的计算公式如下：

G_Convi(m,n,d)＝f(g_Convi(m,n,k)*δ_Convi(1,1,k)+b)

其中，参数m、n分别表示特征图的长和宽，k和d和分别表示浅层特征图降维前的通道数和浅层特征图降维后的通道数，g_Convi(m,n,k)表示浅层特征图Convi且i的取值为3或4，G_Convi(m,n,d)表示g_Convi(m,n,k)降维后的特征图，δ_Convi(1,1,k)表示得到的G_Convi(m,n,d)时所需的1×1的卷积核，b表示得到G_Convi(m,n,d)时所需的标量参数，*表示卷积，f()表示激活函数；

所述步骤S203中将降维后的特征图Conv3和Conv4与特征图Conv5中进行融合的计算公式如下：

F_new(m,n,d)＝∑λ_iG_Convi(m,n,d)+γg_Conv5(m,n,d)

其中，常量参数λ_i和γ分别表示特征图融合时浅层特征图和最深层特征图的权值，F_new(m,n,d)表示新特征图，g_Conv5(m,n,d)表示特征图Conv5；

步骤S3：通过RPN网络获取区域建议；

步骤S4：把新特征图和区域建议输入到后续网络层中得到目标检测结果。

2.根据权利要求1所述的目标检测方法，其特征在于，所述步骤S201包括以下步骤：

步骤S2011：根据卷积神经网络提取的不同层次的特征图具有的不同特点，总结出将浅层特征图降维后和最深层特征图进行融合得到新特征图；

步骤S2012：根据特征图融合及ZF网络的结构、卷积层数及各层次特征图需要降维的具体情况，确定选取ZF网络中第3层和第4层卷积层产生的特征图Conv3和Conv4。

3.根据权利要求1所述的目标检测方法，其特征在于，所述步骤S3包括以下步骤：

步骤S301：将新特征图输入到RPN网络中得到候选窗口，其过程如下：利用3×3的卷积核在输入的新特征图上滑动，并在3×3的卷积核滑过的每个位置处都生成12种候选窗口，其中包括3种长宽比例{1:1，1:2，2:1}和4种面积种类{64×64，128×128，256×256，512×512}，卷积核滑过新特征图的所有位置后得到所有的候选窗口；

步骤S302：利用Softmax层从中选取包含目标的候选窗口，其过程如下：Softmax层是一种具有多分类功能的卷积神经网络层，将候选窗口分成包含目标的候选窗口和不包含目标的候选窗口，且Softmax层为每一个包含目标的候选窗口生成一个分数，根据该分数选取候选窗口；

步骤S303：通过非极大值抑制对包含目标的候选窗口进行再次筛选，并将筛选出的候选窗口作为RPN网络的输出，得到区域建议。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于燕山大学，未经燕山大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201810843493.3/1.html，转载请声明来源钻瓜专利网。

上一篇：基于电量曲线特征模型的线损异常诊断方法及装置
下一篇：一种路基含水状态的确定方法及确定系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种利用特征图融合的目标检测方法有效

专利文献下载