[发明专利]一种面向计算机视觉应用的轻量化无锚框目标检测方法有效
申请号: | 202010257831.2 | 申请日: | 2020-04-03 |
公开(公告)号: | CN111476252B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 徐小龙;赵家瀚 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06T3/40;G06T7/73 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 向文 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 计算机 视觉 应用 量化 无锚框 目标 检测 方法 | ||
1.一种面向计算机视觉应用的轻量化无锚框目标检测方法,其特征在于:包括如下步骤:
1)利用结合了标准化空洞卷积组并采用轻量化设计的主干网络提取输入图片的特征;
2)利用步骤1的主干网络中挑选出的尺度不同的特征图构建轻量化特征金字塔结构;
3)将步骤2得到的特征金字塔上每层特征图的每个像素点坐标映射回输入图片,得到所有预测边框在输入图片中的中心点坐标;
4)将特征金字塔的特征图都连接结构相同的轻量化预测分支,获取预测边框信息;
5)将图片通过训练好的网络,由步骤3得到的所有预测边框中心点坐标和步骤4得到的预测边框信息进行解码和计算,得到所有预测边框;
6)对步骤5得到的预测边框进行非极大值抑制得到最终检测识别结果;
所述步骤2中轻量化特征金字塔结构的具体构建过程为:
从主干网络特征图里挑选出尺度不同的N层特征图,通过横向连接和双线性插值上采样,自顶向下做特征融合,最后再采用卷积核对每个融合结果进行卷积消除上采样的混叠效应,得到N个特征图,再由其中一个特征图通过M次下采样,得到M个特征图,从而由N个特征图和M个特征图构建N+M层结构的轻量化特征金字塔结构。
2.根据权利要求1所述的一种面向计算机视觉应用的轻量化无锚框目标检测方法,其特征在于:所述步骤1中的主干网络包括分组置乱模块,分组置乱模块按规则堆叠构成标准化空洞卷积组,所述主干网络由标准化空洞卷积组与下采样单元交替堆叠构成。
3.根据权利要求1所述的一种面向计算机视觉应用的轻量化无锚框目标检测方法,其特征在于:所述步骤3的具体过程为:
由步骤2得到的特征金字塔上的N+M层特征图分别对输入图片进行下采样,设N+M层特征图中某一层上的某一个像素点坐标为(xp,yp),且该层对输入图片进行了步幅为s倍的下采样,则这个像素点映射到输入图片上的坐标,即该像素点代表的预测边框在输入图片上的中心点坐标(x,y)为:
按此规则,将这些特征图上的每个像素点坐标映射回原图,得到所有预测边框在原图中的中心点坐标。
4.根据权利要求1所述的一种面向计算机视觉应用的轻量化无锚框目标检测方法,其特征在于:所述步骤4中轻量化预测分支分两路,每路都由一个卷积开始,其后第一路再次通过两次卷积得到通道数为预测类别数的分类分支和中心偏离分支,第二路通过卷积得到回归分支,轻量化预测分支包含预测边框的所有信息:分类分支为预测边框的类别置信度;中心偏离分支为预测边框的中心偏离值;回归分支为预测边框中心点到四边距离。
5.根据权利要求4所述的一种面向计算机视觉应用的轻量化无锚框目标检测方法,其特征在于:所述步骤5中将图片通过网络,由步骤3得到的所有预测边框中心点坐标和步骤4的归回分支中的预测边框中心点到四边距离信息计算得到所有预测边框在输入图片中的左上角和右下角坐标,将步骤4的分类分支中预测边框的类别置信度乘以中心偏离分支中的预测边框的中心偏离值,得到预测边框的最终类别置信度。
6.根据权利要求4所述的一种面向计算机视觉应用的轻量化无锚框目标检测方法,其特征在于:所述预测分支的分类分支损失函数表达式为:
预测分支的回归分支损失函数表达式为:
其中,(x,y)为特征金字塔的特征图上的像素点映射回输入图片上的坐标,Lcls为焦点损失函数,Lreg为交并比损失函数,pxy为以点(x,y)为中心的预测边框的类别,为点(x,y)所归属的真实边框的类别,tx,y为点(x,y)到以其为中心的预测边框的四边距离,为点(x,y)到其所归属的真实边框的四边距离,Npos为正样本数量,在以点(x,y)为中心的预测边框类别不是背景类时置1,是背景类时置0;
中心偏离值centerness*表达式为:
其中l*、r*、t*、b*为具体内容,分别是点(x,y)到其所归属的真实边框的左边、右边、上边、下边的距离,预测分支的中心偏离分支损失函数就是以二值交叉熵损失函数训练中心偏离值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010257831.2/1.html,转载请声明来源钻瓜专利网。