[发明专利]一种基于改进的YOLO6D算法的位姿估计系统及方法在审
申请号: | 202110703620.1 | 申请日: | 2021-06-24 |
公开(公告)号: | CN113436251A | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 张楚宁;高天寒;江欣蓓 | 申请(专利权)人: | 东北大学 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06T5/00;G06N3/04;G06N3/08 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 yolo6d 算法 估计 系统 方法 | ||
1.一种基于改进的YOLO6D算法的位姿估计系统,其特征在于,所述系统包括:
视觉传感器,用于实时采集目标物体的图像,并将图像发送给客户端;
客户端,用于实时捕获图像并发送给服务器端,以及接收服务器端发送的目标物体位姿估计结果;
服务器端,用于构建YOLO6D模型的训练数据集;对YOLO6D模型进行改进;利用所述训练数据集对改进的YOLO6D模型进行训练,获得位姿估计模型;利用所述姿态估计模型实时估计图像中目标物体的位姿,并将目标物体位姿估计结果发送给客户端。
2.根据权利要求1所述的基于改进的YOLO6D算法的位姿估计系统,其特征在于,所述视觉传感器是单目摄像机。
3.使用权利要求1所述的基于改进的YOLO6D算法的位姿估计系统的基于改进的YOLO6D算法的位姿估计方法,其特征在于,所述方法包括以下步骤:
采集包含目标物体的原始图像;
对包含目标物体的原始图像进行处理得到边缘清晰的目标物体图像;
构建YOLO6D模型的训练数据集;
对YOLO6D模型进行改进,包括:为对称目标物体和非对称目标物体定义两种不同的损失函数;
利用所述训练数据集对改进的YOLO6D模型进行训练,获得位姿估计模型;
利用所述姿态估计模型实时估计图像中目标物体的位姿。
4.根据权利要求3所述的基于改进的YOLO6D算法的位姿估计方法,其特征在于,所述构建YOLO6D模型的训练数据集的方法为:对公开的位姿估计数据集进行数据量扩充,获得新的位姿估计数据集;自制虚拟数据集;将新的位姿估计数据集和虚拟数据集进行整合,从整合后的数据集中划分出若干图像作为训练数据集。
5.根据权利要求4所述的基于改进的YOLO6D算法的位姿估计方法,其特征在于,所述对公开的位姿估计数据集进行数据量扩充的方法为:根据数据集中提供的掩模提取目标物体的图像像素,做换背景操作,将目标物体的图像像素粘贴到不包含目标物体仅包含复杂背景的其他若干图片上,并对换背景操作之后的若干图片进行数据增强得到新的若干图片,增添到位姿估计数据集中,实现对公开的位姿估计数据集的数据量扩充。
6.根据权利要求4或5所述的基于改进的YOLO6D算法的位姿估计方法,其特征在于,所述公开的位姿估计数据集为LineMod数据集。
7.根据权利要求4所述的基于改进的YOLO6D算法的位姿估计方法,其特征在于,所述自制虚拟数据集的方法为:通过Perception Package工具合成包含目标物体且具有复杂背景的若干RGB图片,并为每一幅图片设置对应的标注信息,获得虚拟数据集;所述标注信息包括:目标物体的空间信息和类别信息。
8.根据权利要求3所述的基于改进的YOLO6D算法的位姿估计方法,其特征在于,所述对YOLO6D模型进行改进,包括:为对称目标物体和非对称目标物体定义两种不同的坐标损失函数。
9.根据权利要求8所述的基于改进的YOLO6D算法的位姿估计方法,其特征在于,非对称目标物体的坐标损失函数计算公式如下:
其中,n是待估计位姿的图像的像素数量;M是带有标注的图像中包含目标物体的像素;Ii为待估计位姿的图像的第i个像素;为数据集中的带有标注的图像的第i个像素;α为不小于1的因子;
对称目标物体的坐标损失函数计算公式如下:
L=minLcoo(I,RPIgt) (5)
其中,RP是一个位姿到对称位姿的转换;I为待估计位姿的图像;Igt为带有标注的图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110703620.1/1.html,转载请声明来源钻瓜专利网。