[发明专利]基于深度学习的移动机器人视觉导航方法在审
申请号: | 201811064016.3 | 申请日: | 2018-09-12 |
公开(公告)号: | CN109341689A | 公开(公告)日: | 2019-02-15 |
发明(设计)人: | 阮晓钢;任顶奇;朱晓庆;刘少达;李昂;武悦 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G01C21/20 | 分类号: | G01C21/20;G06T7/73;G06T7/55 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 彩色图像 目标检测 移动机器人视觉导航 未知环境 打标 机器人 采集 图像 深度摄像机 深度图计算 移动机器人 目标位置 深度图像 生成运动 实时采集 输入目标 彩色图 预设 学习 图片 检测 探索 | ||
1.基于深度学习的移动机器人视觉导航方法,其特征在于:包括以下步骤,
步骤1:机器人在未知环境中随机探索,并以给定的频率拍摄图像,并将图像按拍摄时间序列进行命名并保存;
步骤2:采用打标工具对采集的RGB图像进行打标;
步骤3:用目标检测模型对打标图像进行训练,得到满足要求的目标检测模型;
步骤4:用户输入机器人要到达的目标;
步骤5:机器人通过自身搭载的RGB-D深度相机采集图片;
步骤6:机器人根据RGB图通过目标检测模型进行目标检测;
步骤7:检测到目标后机器人根据彩色图与深度图计算目标位置的坐标;
步骤8:机器人根据运动控制策略朝向目标位置行进。
2.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:以图片为输入,通过目标检测模型对目标进行识别,对目标大致基本方位进行认知,再根据深度图计算机器人距离目标的精确距离;使用轮式移动机器人搭载视觉传感器。
3.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:在步骤1中需要对图片进行处理,其中对图片的处理为缩放处理,采集到的图片像素值为640*480,经过缩放后像素值为320*240。
4.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:在步骤3中目标检测模型为卷积神经网络,网络采用卷积层和池化层的结构;输入层为480*480*3,后面是3个卷积池化层,最后是一个平均池化层和Softmax层;第一层是96个3*3步长为2的卷积核,然后是一个2*2的池化层;第二层是72个3*3步长为2的卷积核,然后是一个2*2的池化层;第三层是48个3*3步长为2的卷积核,然后是一个2*2的池化层;最后是一个24个2*2卷积核的平均池化层和全连接层,其中全连接层的神经元个数为3*3*15。
5.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:目标检测算法的输入为经过打标的RGB图像,输出为目标类别和在图像中的位置向量[pc,bx,by,bh,bw,c],其中pc为边框中物体为类别c的概率,bx为边框中心的横坐标,by为边框中心的纵坐标,bh为边框的高度,bw为边框的宽度,c为目标类别向量[c1,c2,c3,...,cN],N为目标类别向量元素的个数。
6.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:在步骤4中对目标的输入是语音输入或者是文字输入,机器人根据输入的字符找到其对应的编码,其中编码为[0,1,2,...,N-1]。
7.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:在步骤5中对所采集图片进行同步骤1相同的缩放处理。
8.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:在步骤6中目标物体在图片中的位置信息[bx,by,bh,bw]。
9.根据权利要求1所述的基于深度学习的移动机器人视觉导航方法,其特征在于:在步骤7中,以相机坐标系作为世界坐标系,相机所在位置为坐标原点,以步骤6中边框的中心[bx,by]作为目标在深度图中的位置,根据像素坐标与相机坐标的转换关系得到目标位置的实际坐标;
像素坐标为[u,v,d],假设相机坐标pc为[x,y,z],相机坐标到像素坐标的关系为:
其中u=bx,v=by,[u,v]为像素点在像素平面坐标系中的坐标,d为像素点的深度值,[x,y,z]为像素点在相机坐标系中的三维坐标,x轴方向为水平方向,y轴方向为竖直方向,z轴方向为垂直相机平面向外,K为相机的内参数矩阵,K由相机本身决定;
计算目标在相机坐标系下的坐标pc[x,y,z];
z=d/s
在步骤8中的预设距离为20cm;cx,cy,fx,fy为构成K的相机内参,cx,cy为相机光圈中心,fx,fy为相机在x,y两个轴上的焦距,s为深度图的缩放因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811064016.3/1.html,转载请声明来源钻瓜专利网。