[发明专利]物体姿态估计方法、装置与设备在审
申请号: | 201911274158.7 | 申请日: | 2019-12-12 |
公开(公告)号: | CN111161349A | 公开(公告)日: | 2020-05-15 |
发明(设计)人: | 张能波;王磊;程俊 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳中一联合知识产权代理有限公司 44414 | 代理人: | 符亚飞 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 姿态 估计 方法 装置 设备 | ||
1.一种物体姿态估计方法,其特征在于,包括:
采用预先训练的多层次特征提取网络模型对目标物体的目标图像进行预测,得到所述目标物体的关键点坐标信息;其中,所述多层次特征提取网络模型用于对三维物体的二维图像采用多层特征提取网络进行特征提取后,对各层特征提取网络的输出特征图进行特征融合得到目标特征图,然后对所述目标特征图进行姿态回归预测,得到所述三维物体的关键点在所述二维图像上的投影坐标;所述目标物体的关键点坐标信息包括所述目标物体的关键点在所述目标图像上的投影坐标;
根据所述目标物体的关键点坐标信息和所述目标物体的关键点的空间位置关系,确定相机相对于物体的坐标转换关系。
2.根据权利要求1所述的方法,其特征在于,在所述采用预先训练的多层次特征提取网络模型对目标物体的二维图像进行预测之前,所述方法还包括:
对获取的多个样本物体的各样本图像进行图像预处理和数据增强处理,得到目标样本图像集,所述目标样本图像集中包括多个所述样本物体的多个目标样本图像;
根据所述目标样本图像集和获取的样本图像对应的标签数据,生成样本集,所述样本集中的样本包括样本物体的目标样本图像和所述样本物体的多个关键点在所述样本物体的目标样本图像上的投影坐标;
采用所述样本集训练初始多层次特征提取网络模型,得到所述多层次特征提取网络模型。
3.根据权利要求2所述的方法,其特征在于,所述对获取的多个样本物体的各样本图像进行图像预处理和数据增强处理,得到目标样本图像集,包括:
对于每个样本物体的每个样本图像,根据所述样本物体的所述样本图像和所述样本物体的掩码图像提取出所述样本物体在所述样本图像中对应的目标图像区域;
将所述目标图像区域与目标背景图像进行融合,生成所述样本物体的预处理图像;
对各所述样本物体的预处理图像进行数据增强处理,生成各所述样本物体的目标样本图像。
4.根据权利要求1所述的方法,其特征在于,训练所述多层次特征提取网络模型采用的损失函数是根据所述各层特征提取网络的特征损失和特征融合损失确定的。
5.根据权利要求4所述的方法,其特征在于,所述多层次特征提取网络模型的损失函数的计算公式如下:
其中,Loss表示多层次特征提取网络模型的损失函数,n表示特征提取网络的层数,Fi表示第i层特征提取网络的输出特征图,Fo表示目标特征图,L表示特征图的损失函数,L的计算公式如下:
其中,L(F)表示特征图F的损失函数,(x′Fj,y′Fj)表示特征图F的姿态回归预测结果中第j个关键点在输入的二维图像上的投影坐标,(xj,yj)表示第j个关键点在输入的二维图像上的投影坐标真值,m表示关键点数量。
6.根据权利要求1所述的方法,其特征在于,所述多层次特征提取网络模型采用如下公式对各层特征提取网络的输出特征图进行特征融合得到目标特征图:
其中,Fo表示目标特征图,αi表示第i层特征提取网络的输出特征图的注意力系数,n表示特征提取网络的层数,Fi表示第i层特征提取网络的输出特征图,Φ(Fi)表示第i层特征提取网络的输出特征图的处理函数,Φ(Fi)的计算公式如下:
其中,C表示滤波器的数量,Wc表示第c个滤波器,Fic表示第i层特征提取网络的第c个通道的输出特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911274158.7/1.html,转载请声明来源钻瓜专利网。