[发明专利]一种能应对复杂背景并且更精确的三维姿态估计算法在审
申请号: | 202211077522.2 | 申请日: | 2022-09-05 |
公开(公告)号: | CN115482448A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 杜宇;刘冬;张犇;李金钟;田小静;丛明 | 申请(专利权)人: | 大连交通大学;大连理工大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/774;G06V20/64 |
代理公司: | 辽宁鸿文知识产权代理有限公司 21102 | 代理人: | 许明章;王海波 |
地址: | 116028 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应对 复杂 背景 并且 精确 三维 姿态 估计 算法 | ||
1.一种能应对复杂背景并且更精确的三维姿态估计算法,其特征在于,包括以下步骤:
(1)采集包含检测目标的若干张图像;
(2)依据LineMod数据集格式制作训练用数据集;
(3)对YOLO-6D算法进行改进,改进具体包括以下两部分:
将原YOLO-6D算法中的YOLOV2检测网络变更为YOLOV3网络,并融入注意力模块作为检测网络;网络的输入为单张RGB图像,将图像均匀划分为S×S个规则的cell,经检测网络后每个cell可输出一个多维向量,存放8个3D包络框角点及物体中线点坐标信息,目标物体的分类概率及整体置信度;网络包含三个预测特征层Box1、Box2和Box3,并在特征层Box1中融入注意力机制,使其可以在空间上融合更多的特征;
经上述检测网络后,所有的cell都会有一个置信度,选取置信度最高的cell,以该cell为基点选取正方形cell群;置信度最高的cell可能出现的位置有三种,cell群的选择也会对应有3种方式;对选中的9个cell做基于RANSAC的EpnP位姿估计,RANSAC使用投票机制来寻找优化的拟合结果;
(4)使用步骤(2)得到的数据集,采用步骤(3)改进后的算法训练,得到目标检测模型;训练目标检测模型的过程中,使用置信度函数c(x)评估目标物体的预测姿态与真实姿态间的偏差情况:
(5)使用训练得到的目标检测模型对待检测目标进行检测,获取目标物体的分类信息以及6D姿态信息;检测的过程中需要进行坐标偏移,保证目标位于图像划分后的cell格子内。
2.根据权利要求1所述的一种物体检测与姿态估计方法,其特征在于,所述的步骤(3)中,选用SENet网络作为融入的注意力机制,SENet网络通过学习特征权重获取每个特征图的重要程度,能够加大有效特征图权重并降低无效特征图权重;经过SENet网络后的图像会分成两支,其中一支经卷积到13×13的第一个预测特征层,使用1×1的卷积核预测器进行预测,另外一支会通往另一个卷积层,再经上采样,高和宽会变成原来的两倍即26×26,并与网络中Box2内的残差网络输出进行融合;与此同时,拼接之后的矩阵也经特征提取器处理,分为两个分支,其中一支通向第二个预测特征层,另一支通往1×1卷积层,进行上采样,再与Box3内残差网络的输出融合;融合的结果通过特征提取器,再经卷积得到第三个预测特征层。
3.根据权利要求1所述的一种物体检测与姿态估计方法,其特征在于,所述的步骤(4)中,基于欧式距离使用如下述公式所示的置信度函数c(x)评估目标物体的预测姿态与真实姿态间的偏差情况;
其中,DT(x)代表欧式距离,dth表示置信度函数的像素阈值,α表示c(x)函数的锐利程度。
4.根据权利要求1所述的一种物体检测与姿态估计方法,其特征在于,步骤(2)中所述的数据集中包括:包含待检测目标的若干张图像、添加的噪声图像、图像掩码以及每幅图像对应的标注信息,其中标注信息包括:图像中是否包含检测目标、分类信息以及待检测目标的空间信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连交通大学;大连理工大学,未经大连交通大学;大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211077522.2/1.html,转载请声明来源钻瓜专利网。