[发明专利]一种实时6D位姿估计方法及计算机可读存储介质在审
申请号: | 202111669299.6 | 申请日: | 2021-12-31 |
公开(公告)号: | CN114359377A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 梁斌;刘厚德;黄俊楠;夏崇坤;王学谦 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06T7/66;G06K9/62;G06V10/80;G06V10/764;G06V10/82;G06N3/04;G06N3/08 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 孟学英 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实时 估计 方法 计算机 可读 存储 介质 | ||
本发明提供一种实时6D位姿估计方法及计算机可读存储介质,方法包括:从目标物体的三维模型中选取预设关键点并得到所述预设关键点在所述三维模型中基于三维模型原点坐标系下的坐标;通过网络预测所述目标物体的所述预设关键点在实际场景中基于相机坐标系下的坐标;将所述预设关键点在所述三维模型原点坐标系下的坐标和在所述相机坐标系下的坐标进行拟合计算得到所述目标物体当前的位姿。使得网络具备了优秀的实时性,实现了同等速度下的最高位姿估计精度。
技术领域
本发明涉及位姿估计技术领域,尤其涉及一种实时6D位姿估计方法及计算机可读存储介质。
背景技术
随着机器人技术的迅猛发展,机器人灵巧操作在工业自动化和人们日常生活中的应用也愈加广泛。对于目标物体的实时6D位姿估计是机器人实现灵巧操作的首要前提,直接影响着机器人对物体操作的稳定性与连贯性。
目标物体的6D位姿表示物体在笛卡尔空间中的6个自由度,包括3个位移(平移)自由度和3个空间旋转自由度。位姿是一个相对概念,用于表示两个坐标系之间的相对刚性变换关系。由于在实际应用中相机与机器人之间相对关系是已知的,所以在本发明中6D位姿估计指的是待估计物体自身坐标系与相机坐标系之间变换关系。
常见的物体6D位姿估计方法可以分为基于RGB图像、基于点云、基于RGB-D图像三种。基于RGB图像的位姿估计算法主要依靠采用人工设计的特征提取算子或者卷积神经网络来从图像中提取出物体的纹理特征,并依据这些特征来估计待测物体的6D位姿信息。但该方法十分依赖图像中的物体纹理信息,在面对低纹理物体或者光照变化较大的场景时难以保证较好精度。基于点云的位姿估计方法主要依靠激光雷达获取点云信息,但激光雷达价格昂贵且安装条件较为苛刻,难以部署到机械臂上;同时因为雷达的点云信息较为稀疏,不利于实现小物体的位姿估计。随着近些年技术的发展,深度相机价格逐步降低,这也使得基于RGB-D的位姿估计方法得到重视。RBG-D图像中既包含了RGB图像中的纹理信息也包含了深度图像中的几何信息,有利于进一步提高位姿估计算法的精度,但如何快速地处理这些大量的信息也成为一个不容忽视的问题。在先前基于RGB-D图像的位姿估计算法(Frustum-P、PVN3D、FFB6D)等都是在提取特征后不加区分地直接用于位姿估计。由于没有合理对特征进行分类利用,这类网络往往需要非常复杂的特征提取网络来保证位姿估计的速度,这也极大地限制了它们的实时性,因此这类方法很难被部署到实际应用中去。
以上背景技术内容的公开仅用于辅助理解本发明的构思及技术方案,其并不必然属于本专利申请的现有技术,在没有明确的证据表明上述内容在本专利申请的申请日已经公开的情况下,上述背景技术不应当用于评价本申请的新颖性和创造性。
发明内容
本发明为了解决现有的问题,提供一种实时6D位姿估计方法及计算机可读存储介质。
为了解决上述问题,本发明采用的技术方案如下所述:
一种实时6D位姿估计方法,其特征在于,包括如下步骤:S1:从目标物体的三维模型中选取预设关键点并得到所述预设关键点在所述三维模型中基于三维模型原点坐标系下的坐标;S2:通过网络预测所述目标物体的所述预设关键点在实际场景中基于相机坐标系下的坐标;S3:将所述预设关键点在所述三维模型原点坐标系下的坐标和在所述相机坐标系下的坐标进行拟合计算得到所述目标物体当前的位姿。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111669299.6/2.html,转载请声明来源钻瓜专利网。