[发明专利]基于任意四边形回归的目标检测与精确定位方法在审
申请号: | 202211365117.0 | 申请日: | 2022-11-03 |
公开(公告)号: | CN115719414A | 公开(公告)日: | 2023-02-28 |
发明(设计)人: | 李晖晖;冯昱霖;刘航 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V10/22 | 分类号: | G06V10/22;G06V10/82;G06V10/46;G06V10/80;G06V20/52;G06V10/774;G06V10/764;G06N3/0464;G06N3/084 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 王鲜凯 |
地址: | 71007*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 任意 四边形 回归 目标 检测 精确 定位 方法 | ||
1.一种基于任意四边形回归的目标检测与精确定位方法,其特征在于步骤如下:
步骤1:构建基于任意四边形回归的目标检测网络模型,该模型基于Faster RCNN网络模型搭建,于Faster RCNN网络的ROI Align池化层与边框回归分支的输出端连接基于多重注意力机制特征交互融合的关键点检测分支Grid Head;
所述关键点检测分支Grid Head基于全卷积网络搭建,包括用于特征提取的卷积序列、增大特征局部映射模块、特征交互融合模块、改变特征尺寸的反卷积层以及混合级联结构;使用卷积序列对输入的待检测图像特征进行特征提取,特征提取后增大特征并进行局部映射,再使用基于多重注意力机制的特征融合模块对提取的特征进行多级融合处理,将融合输出的特征图输入到多层反卷积层,输出用于提取关键点坐标的热力图,利用多任务多阶段的混合级联结构与信息交互结合边框回归结果进一步提精,将最终得到的热力图转换得到待检测目标关键区域的任意四边形四个顶点Grid Point的坐标信息;
步骤2:于监控设备下自行采集目标图片数据并整理,划分图像训练集、验证集和测试集后,对每一幅目标图像分别进行相应的数据增强手段,增强处理前后的图像共同构成目标图像数据集;
步骤3:以步骤2得到的图像数据集中的训练集与验证集为输入,采用随机梯度下降法对步骤1构建的基于任意四边形回归的目标检测网络模型进行训练,得到训练好的网络模型,使用测试集对得到的网络模型进行性能评估;
步骤4:将待检测的目标图像输入到步骤3训练好的网络模型中,输出得到类别信息和目标关键区域任意四边形的顶点坐标,在完成目标检测的基础上进一步精确定位。
2.根据权利要求1所述的一种基于任意四边形回归的目标检测与精确定位方法,其特征在于:所述步骤1的增大特征局部映射的具体过程如下:
对于待检测的目标来说,所有的Grid Point共享一个相同的特征表达区域,为了解决特征表达区域的问题,改变热力图预测的关键点位置坐标与该点对应于原图位置坐标的映射关系,过程为:
首先,将输入Grid Head的特征图的宽高扩大到原来的两倍,增大特征图在原图上映射的区域,将Grid Point包含在RPN网络生成的候选框内部;
然后,将放大后的特征图按照Grid Point所在的位置局部映射,对于每个Grid Point,新的输出代表了整张特征图四分之一的区域,四个Grid Point对应的热力图由完整特征的不同区域生成,而不是所有的关键点共享一个相同的特征表达区域;
处理后,每个Grid Point的表达能近似地视为一个归一化的过程,在不增加计算量的同时,提升了定位精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211365117.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电容器接线端子生产设备
- 下一篇:直连链路建立方法、装置、设备及存储介质