[发明专利]一种利用深度卷积神经网络实现视觉运动控制的方法有效
申请号: | 201910057143.9 | 申请日: | 2019-01-22 |
公开(公告)号: | CN109919969B | 公开(公告)日: | 2022-11-22 |
发明(设计)人: | 张宏;陈炜楠;朱蕾;何力;管贻生 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06T7/215 | 分类号: | G06T7/215;G06T7/11;G06N3/04 |
代理公司: | 广东广信君达律师事务所 44329 | 代理人: | 杨晓松 |
地址: | 510062 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 利用 深度 卷积 神经网络 实现 视觉 运动 控制 方法 | ||
本发明公开了一种利用深度卷积神经网络实现视觉运动控制的方法,只需要单目相机获取移动平台的当前图像,以及只需要对当前获取的单帧图像进行分析,便可得到当前视角下的合理运动控制规划。不需要通过多帧图像的多图像关联得到移动平台的定位信息,同时也不需要进行特征点数据匹配以及平面映射。另外,与已有的基于神经网络的视觉运控方案不同,本发明不需要进行路标识别以及特征点提取。再者,本发明利用深度神经网络具有语义分割的能力,对当前获取图像进行语义分割。并直接将该分割结果用以运动目标点规划,从单帧图像输入到运动控制目标点的规划,整个过程无需人为先验知识的输入。本发明具有成本低、运控简单快捷等优点。
技术领域
本发明涉及机器人视觉的技术领域,尤其涉及到一种利用深度卷积神经网络实现视觉运动控制的方法。
背景技术
发明内容
本发明的目的在于克服现有技术的不足,提出一种利用深度卷积神经网络实现视觉运动控制的方法。本方法使用深度卷积神经网络对单目视觉传感所采集的图像进行语义分割,以地板、土地等平面为分割目标,以得到当前获得图像视角下的可行驶区域。根据分割结果,通过统计可行驶区域分割结果像素的分布情况,对当前视角下的运动控制目标点进行规划,从而得到运动目标。
为实现上述目的,本发明所提供的技术方案为:
一种利用深度卷积神经网络实现视觉运动控制的方法,包括以下步骤:
S1:在移动平台上安装单目相机,采集移动平台前方的图像信息;
S2:以单帧单目图像作为算法输入,利用深度卷积神经网络进行地面分割,以得到当前获得图像视角下的可行驶区域;
S3:根据分割结果,通过统计可行驶区域分割结果像素的分布情况,对当前视角下的运动控制目标点进行规划,从而得到运动控制目标点;
S4:得到运动控制目标点后,将图像原点假设为当前移动平台所在位置,根据在图像空间得到的运动控制目标点与当前移动平台的相对位置,通过PID运动控制器实现移动平台控制。
进一步地,所述步骤S3通过对可行驶区域分割结果的像素分布进行统计,得到其像素分布沿着图像空间XY方向的分布统计,进而根据该统计情况,在最大可能运动方向上进行目标点规划。
进一步地,所述最大可能运动方向的求解过程为:像素坐标下不同方向的地面延伸程度分别用标准差vx和vy表示,也即是在该方向上移动平台可运动的幅度,利用像素的高斯分布统计,得到最大可能运动方向的解为:
ηdirection=(vx,vy)。
进一步地,所述步骤S3在图像空间根据离散的搜索线集合,进行运动控制目标点规划;具体步骤如下:
在利用高斯分布统计以及图像不同方向的像素分布情况后,为了实现在该方向上的运动目标点的规划,设计一条从点oimage=(mx,my)出发,以ηdirection为方向的线作为中心搜索线lc;
以lc为中心,以oimage为旋转基点,以给定值θ为旋转幅度,向左与向右各旋转i次,从而得到一系列离散的搜索线集合l,该搜索线集合l以lc为中心展开,离散并均匀地覆盖整个图像;
沿着l的每个直线元素,分别从点(mx,my)开始,进行图像检索,一直找到最终一个地面分割有效点结束,进而得到由l的各个元素搜索得到的备选点集合pp;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910057143.9/2.html,转载请声明来源钻瓜专利网。