[发明专利]基于FSAF及快-慢速权重的目标检测与识别方法在审
申请号: | 202111065576.2 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113850256A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 聂振钢;赵乐;卢继华;侯杰继;马志峰;韩航程;谢民 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 fsaf 慢速 权重 目标 检测 识别 方法 | ||
1.基于FSAF及快-慢速权重的目标检测与识别方法,其特征在于:包括如下步骤:
步骤1、搭建包括卷积层、特征图层、预测层的主干网络和RetinaNet有参考框分支;
其中,卷积层的数量就是特征金字塔的层数,记为N,预测层的数量也为N,特征图层的数量为N-2;
步骤1包括如下子步骤:
步骤1.1、原始图像作为第一层卷积层,并依次自下而上进行1/2采样,得到第2层到第N层卷积层,得到特征金字塔;
步骤1.2、对特征金字塔不同层进行特征融合,得到第3到第N层特征图层;
步骤1.3将步骤1.2得到的第N层特征图层及“第N-1到第3层”的特征图层分别进行3×3卷积,得到第N到第3层的预测层,共有N-2层;
步骤1.4将步骤1.1中得到的第N层卷积层单独进行3×3卷积,得到第N+1层预测层;
步骤1.5将步骤1.4得到的第N+1层预测层进行3×3卷积,得到第N+2层预测层;
至此,通过步骤1.3到步骤1.5得到了和卷积层数目相同的N层预测层;
其中,卷积层、特征图层以及预测层也构成了搭建好的主干网络;
步骤1.6、在每层预测层后添加一个RetinaNet有参考框分支;
步骤2、基于步骤1搭建的主干网络和RetinaNet有参考框分支搭建FSAF分支,并生成图像特征层的有效区及忽略区;具体为:在RetinaNet有参考框分支中每个层级的预测层都添加一个无参考框分支,对标准框在不同特征层的映射框按照A1倍比例缩小后作为有效区、A2倍比例缩小后作为忽略区;
其中,所有无参考框分支统称为FSAF分支;
步骤3、基于FSAF分支计算综合损耗;
其中,综合损耗包括分类损耗和回归损耗;
步骤3具体为:
步骤3.A通过式(1)计算分类损耗:
其中,I为给定实例,为给定实例I第l层特征层的分类损耗;为区域内像素点的和,为该层特征层该实例的有效区,FL(l,i,j)为在第l层特征层(i,j)位置上的焦点损耗,该焦点损耗通过(2)计算:
FL(pt)=αt(1-pt)γlog(pt) (2)
其中,焦点损耗,即focal loss,记为FL(pt);pt表示不同类别的分类概率,γ为超参数指数,αt为超参数系数;
步骤3.B通过式(3)计算回归损耗;
其中,为给定实例I第l层特征层的回归损耗,其中,IoU(l,i,j)为在第l层特征层(i,j)位置上的IoU损耗,该IoU损耗为对训练集的标准框和预测框进行对比计算,通过式(4)计算:
其中,Boxp为当前的标准框,Boxl为当前计算得到的预测框;式(4)中分子部分Boxp∩Boxl为Boxp和Boxl公共部分的面积|Boxp∪Boxl|,分母部分为Boxp和Boxl之和的面积,ln为对数函数;
步骤3.B中的标准框通过对实例进行有效区和忽略区处理后,对忽略区以外的区域置0,对标准框的有效区置1得到;对有效区到忽略区之间的位置认为是灰度区域,对该区域的数据不处理;
步骤3.B中的预测框基于损耗计算结果进行在线特征选择后,回传选定的最优化特征层和损耗用于下一次迭代来推理得到,具体为:对每个实例当分支取得结果后,通过求平均得到每层预测层样本的综合损耗,然后选择综合损耗最小一个预测层作为回传特征层;
其中,回传特征层的综合损耗为RetinaNet有参考框分支中优化器的输入,且综合损耗最小一个预测层,即最优化特征层;
步骤4、将步骤3选择的最优化特征层对应的综合损耗输入RetinaNet有参考框分支中的内部标准优化器及LookAhead优化器,使得综合损耗收敛;
步骤4,具体包含以下子步骤:
步骤4.1初始化外循环计数值、目标函数L、慢权重参数φ和快权重参数θ;
其中,外循环计数值记为t,循环计数最大值记为tmax,初始化t=1,初始化慢权重参数φ0;
步骤4.2在第t次外循环中,将外循环计数值为t-1时刻的慢权重参数φt-1赋值给初始化快速权重θ,作为标准优化器的初始参数;
其中,标准优化器运行在Lookahead优化器内循环中,且在内循环中迭代次数为一个同步周期k;
步骤4.3、Lookahead优化器内部的标准优化器通过式(6)在标准优化器内循环的第i次迭代中计算快权重:
θt,i=θt,i-1+A(θt,i-1,d) (6)
其中,A为标准优化器,为标准梯度下降和随机梯度下降两种中的一种;d为当前数据的采样值;θt,i-1为标准优化器所需参数;θt,i是第t次外循环中标准优化器第i次迭代的快速权重优化结果;θt,i-1是第t次外循环中标准优化器第i-1次迭代的快速权重优化结果;
步骤4.4基于步骤4.3的结果通过式(7)更新慢权重参数:
φt=φt-1+β(θt,k-φt-1) (7)
其中,θt,k是第t次外循环中标准优化器第k次迭代的快速权重优化结果;φt-1是外循环计数值为t-1时刻的慢权重参数;φt是外循环计数值为t时刻的慢权重参数;β为Lookahead优化器的迭代参数;
步骤4.5判断外循环计数值t是否等于循环计数最大值tmax,并决定是否完成本方法,具体为:若是,则输出t时刻的慢权重参数φt,完成优化;否则令t=t+1,跳至步骤4.2。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111065576.2/1.html,转载请声明来源钻瓜专利网。