[发明专利]无标记复杂场景中的去中心化多智能体导航方法及系统在审
申请号: | 202111047198.5 | 申请日: | 2021-09-07 |
公开(公告)号: | CN113776537A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 屠长河;吉学博;李贺;潘哲融;高希峰 | 申请(专利权)人: | 山东大学 |
主分类号: | G01C21/20 | 分类号: | G01C21/20;G05D1/02;G06N3/04;G06N3/08 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张庆骞 |
地址: | 266237 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 标记 复杂 场景 中的 中心 智能 导航 方法 系统 | ||
本发明属于机器人导航技术领域,提供了一种无标记复杂场景中的去中心化多智能体导航方法及系统。其中,该方法包括获取各个机器人、路由器和目标点位置,再基于图神经网络得到各个机器人对应的初始控制信号;获取各个机器人的传感器观测信息,再结合初始控制信号和各个机器人的位置,经局部规划器得到各个机器人的最终控制信号。
技术领域
本发明属于机器人导航技术领域,尤其涉及一种无标记复杂场景中的去中心化多智能体导航方法及系统。
背景技术
本部分的陈述仅仅是提供了与本发明相关的背景技术信息,不必然构成在先技术。
无标记多智能体导航问题即机器人可以在若干目标点中任意选择一个作为自身规划目标进行导航,其作为一项基本任务,在移动机器人领域中有众多应用,如搜救、仓库搬运和清洁等。相比于多智能体导航的中心化实现,去中心化实现具有易于部署、稳定性高等优势,因此在近年来被广泛应用,产生了很多去中心化的导航方法。由于深度学习和深度强化学习的蓬勃发展极大地提高了去中心化导航的实时性和可行性,一个很自然的想法就是利用神经网络进行机器人信息处理和决策。在这其中,大多数方法使用机器人自身对环境的观测作为神经网络的输入,经过处理后输出机器人的控制信号。使用这样的思路进行神经网络的构建,结合模仿学习或者深度强化学习,从而使机器人可以进行快速有效的决策。
发明人发现,仅仅基于机器人对环境的观测进行决策是具有很多局限性的,容易在局部配置中做出错误的决策。在实际的场景中,环境往往是复杂且多变的,如果仅仅依靠传感器的局部观测,就只能完成小范围的避障。在这种情况下,如果基于全局环境来看,机器人的避障策略可能是完全错误的,如在迷宫中为了避障走入了一条不通的路,这就会导致多智能体导航在障碍物复杂的场景中的规划成功率降低。有一些方法利用完整的环境信息和机器人位置信息,结合图搜索算法,为每个机器人计算最优的目标分配和路径,再将路径指令下发给每个机器人,然而这类中心化方法往往在实际中难以进行实现,且如果信息传递链路或中心控制器损坏,整个系统就会瘫痪。
发明内容
为了解决上述背景技术中存在的技术问题,本发明提供一种无标记复杂场景中的去中心化多智能体导航方法及系统,其通过对环境的几何分析设置路由器节点,然后利用机器人和路由器之间的多步信息传递和处理,使每个机器人可以了解到环境的全局信息和其他机器人状态,综合所有信息进行决策,从而取得了较高的导航成功率。
为了实现上述目的,本发明采用如下技术方案:
本发明的第一个方面提供一种无标记复杂场景中的去中心化多智能体导航方法,其包括:
获取各个机器人、路由器和目标点位置,再基于图神经网络得到各个机器人对应的初始控制信号;
获取各个机器人的传感器观测信息,再结合初始控制信号和各个机器人的位置,经局部规划器得到各个机器人的最终控制信号。
进一步地,所述路由器位置的计算过程为:
获取环境图像;
对环境图像进行中轴变换和Delaunay变换处理,计算路由器放置位置以及为每个环境构建路线网络。
进一步地,所述图神经网络使用模仿学习算法进行训练。
进一步地,所述图神经网络包含两类节点:机器人节点和路由器节点。
进一步地,所述图神经网络的训练数据集采用中心化的算法生成。
进一步地,所述局部规划器的训练数据集为局部避障数据集,使用障碍物规避算法生成。
进一步地,所述传感器观测信息包括:激光雷达传感器信息。
本发明的第二个方面提供一种无标记复杂场景中的去中心化多智能体导航系统,其包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111047198.5/2.html,转载请声明来源钻瓜专利网。