[发明专利]基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法有效
申请号: | 202010361914.6 | 申请日: | 2020-04-30 |
公开(公告)号: | CN111553949B | 公开(公告)日: | 2023-05-19 |
发明(设计)人: | 张辉;李锟;刘理;钟杭;李晨;王耀南;毛建旭;朱青;易俊飞 | 申请(专利权)人: | 张辉 |
主分类号: | G06T7/73 | 分类号: | G06T7/73;G06T7/11;G06T7/13;G06N3/08;G06N3/0464 |
代理公司: | 长沙市护航专利代理事务所(特殊普通合伙) 43220 | 代理人: | 莫晓齐 |
地址: | 410006 湖南省长沙市岳麓区湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 rgb 图像 深度 学习 不规则 工件 定位 抓取 方法 | ||
1.基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,包括如下步骤:
S1,采集图像:机械臂移动到指定工位,利用深度相机采集抓取目标的单帧RGB图像和深度图像;
S2,归一化处理RGB图像:对RGB图像进行归一化处理;
S3,获得目标类别置信度和目标边界框:归一化处理后的RGB图像输入深度学习的目标检测网络并输出目标类别置信度和目标边界框;
S4,获得目标的多个特征点投影坐标:根据目标边界框调整RGB图像后,将调整后的RGB图像输入深度学习的特征点估计网络,输出多张特征点热力图,根据特征点热力图获得目标的多个特征点投影坐标;在S4步骤中,所述获得目标的多个特征点投影坐标,是首先定义目标的三维特征点,通过深度学习的特征点估计网络预测特征点在RGB图像上的投影坐标,输出多张特征点热力图,根据特征点热力图最大值位置获得目标的多个特征点投影坐标;
S5,估计目标姿态:根据目标的多个特征点投影坐标结合高精度快速求解法EfficientPerspective-n-Point估计目标姿态;
S6,深度图像预处理:对采集的深度图像进行双边滤波处理;
S7,确定目标质心:在深度学习的目标检测网络筛选的多个候选框中,利用候选框并集区域分割预处理后的深度图像,确定目标质心,以目标质心作为抓取点;
S8,抓取目标:对抓取的目标进行姿态校正并结合抓取点根据深度相机坐标系、机械臂坐标系与世界坐标系的转换关系,控制机械臂抓取目标并放置到指定位置。
2.如权利要求1所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,在S3步骤中,归一化后的RGB图像输入目标检测网络前,先要构建并离线训练深度学习的目标检测网络。
3.如权利要求2所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,所述构建并离线训练深度学习的目标检测网络是,先采用COCO数据集上的预训练模型权重载入深度学习的目标检测网络,利用训练样本图像及对应的标签对深度学习的目标检测网络进行离线迭代训练,获得基于深度学习的目标检测网络的目标检测模型。
4.如权利要求1所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,所述深度学习的特征点估计网络预测特征点在RGB图像上的投影坐标,是通过定义的目标三维特征点在RGB图像上的投影制作特征点热力图标签,再利用训练样本图像及对应的特征点热力图标签离线迭代训练深度学习的特征点估计网络,用训练完成的深度学习的特征点估计网络来预测特征点在RGB图像上的投影坐标。
5.如权利要求4所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,所述目标的三维特征点是采用最远点采样法定义。
6.如权利要求1所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,在S7步骤中,所述候选框并集区域是在深度学习的目标检测网络筛选的候选框中选择多个特定的候选框求取候选框并集区域,根据并集区域分割预处理后的深度图像,然后用边缘检测法分割目标轮廓并确定目标质心;其中,所述候选框并集区域是在深度学习的目标检测网络筛选的候选框中选择多个特定的候选框求取候选框并集区域包括:在深度学习的目标检测网络中每个目标筛选的候选框中选择m个候选框,对m个候选框按照目标类别置信度大小排序为A1,A2,…,Am并标记A1候选框,剩下的候选框与A1候选框求取交并比,记录前几个交并比最大值对应的候选框并与A1一起求取并集区域。
7.如权利要求1至6任一项所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,所述特征点估计包括4个编码器和3个解码器。
8.如权利要求7所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,所述深度学习的特征点估计网络中加入残差结构和跳跃连接进行特征融合。
9.如权利要求8所述的基于单帧RGB-D图像深度学习对不规则工件的定位抓取方法,其特征在于,所述深度学习的特征点估计网络中线性上采样层采用双线性插值法提高输入图像的分辨率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于张辉,未经张辉许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010361914.6/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序