[发明专利]一种具备全范围信息恢复能力的机器人导航避障方法在审
申请号: | 202210860489.4 | 申请日: | 2022-07-21 |
公开(公告)号: | CN115167430A | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 张伟;曹睿;李晓磊;谢世宽;赵越男;李传鹏;李宇 | 申请(专利权)人: | 山东大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 于凤洋 |
地址: | 250061 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 具备 范围 信息 恢复 能力 机器人 导航 方法 | ||
本公开提供了一种具备全范围信息恢复能力的机器人导航避障方法,包括获取周围环境数据,获取原始雷达和当前雷达的观测数据,构建历史观测数据队列,将当前最新的雷达观测数据以及位姿插入历史队列中,使历史观测数据与当前观测数据融合,形成机器人周围360°范围内环境的新的观测感知结果;利用新的感知结果在优化更新的策略函数网络中输出的概率分布来选择机器人下一步的避障动作,直至到达目标点;能够在考虑当前观测的基础上,结合一定范围内的历史观测数据,将已经通过但仍然会对其之后动作产生影响的障碍物保留一定程度的记忆。
技术领域
本公开涉及机器人避障技术领域,具体涉及一种具备全范围信息恢复能力的机器人导航避障方法及系统。
背景技术
本部分的陈述仅仅是提供了与本公开相关的背景技术信息,不必然构成在先技术。
避障是机器人导航必不可少的功能之一。避障算法可分为基于地图(map-based)和反应式(reactive)两种,基于地图的算法由于需要实时更新障碍物地图,往往计算量较大,而且对于动态障碍物的躲避效果相对较差;反应式算法对从传感器获得的信息直接分析计算,得出机器人控制量,对于动态障碍物的实时避障效果有不错的提升,并且对不同环境的适应能力较强。现有的反应式避障算法往往只考虑当前时刻感知范围内的障碍物情况,如果在移动过程中某动态障碍物从感知范围内离开,但此时若其仍然在机器人周边一定范围内还是会对机器人的移动产生影响,此类情况会导致机器人发生二次碰撞,引发机器人移动安全问题。
发明内容
本公开为了解决上述问题,提出了一种具备全范围信息恢复能力的机器人导航避障方法,能够在考虑当前观测的基础上,结合一定范围内的历史观测数据,将已经通过但仍然会对其之后动作产生影响的障碍物保留一定程度的记忆,避免出现刚刚避过某一障碍物却因为躲避另一方向上的障碍物而导致的与历史障碍物发生二次碰撞的情况。
根据一些实施例,本公开采用如下技术方案:
一种具备全范围信息恢复能力的机器人导航避障方法,训练步骤为:
在仿真环境三维空间中建立机器人坐标系,并在一定区域内随机生成障碍物的位置、以及机器人的起始点和目标点;
获取周围环境数据,基于状态空间、动作空间、奖励函数、状态转移概率、观测空间以及观测概率分布建立环境模型;
获取原始雷达和当前雷达的观测数据,构建历史观测数据队列,将当前最新的雷达观测数据以及位姿插入历史队列中,使历史观测数据与当前观测数据融合,形成机器人周围360°范围内环境的新的观测感知结果;
利用新的感知结果在优化更新的策略函数网络中输出的概率分布来选择机器人下一步的避障动作,直至到达目标点。
进一步的,建立的观测空间包括机器人对于原始数据补全后的感知结果、机器人当前速度、目标点在机器人局部坐标系下的坐标位置。
与现有技术相比,本公开的有益效果为:
本公本使用基于Actor-Critic框架的PPO强化学习算法作为训练基础算法,建立机器人避障导航模型,并在此算法的观测数据获取以及奖励设置步骤中进行了改进。为观测数据增加历史信息,对多帧原始的雷达数据进行相应处理与融合,得到含有一定记忆功能的,可表示机器人周围360°范围内的障碍物距离信息的感知信息,使其具备全范围信息恢复能力,其中还包括了相关距离信息的时间特征,并将此感知信息送入深度学习网络中得到观测到动作的映射关系。实现了机器人在未知环境下的自主导航避障,提升了传统反应式避障算法对动态障碍物的避障性能;改善了雷达感知受限的情况,避免出现由于机器人的移动导致的障碍物离开感知区域,但其仍可能对机器人之后的移动造成影响而带来的二次碰撞问题。
附图说明
构成本公开的一部分的说明书附图用来提供对本公开的进一步理解,本公开的示意性实施例及其说明用于解释本公开,并不构成对本公开的不当限定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210860489.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种产品智能化互动展售系统
- 下一篇:一种睡眠喷雾生产线监控系统及监控方法
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置