[发明专利]一种用于山地环境下的多智能体协同搜索节能方法有效
申请号: | 202210177844.8 | 申请日: | 2022-02-25 |
公开(公告)号: | CN114610024B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 李博;张红雨;韦旭东;吴磊;钟山 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 成都巾帼知识产权代理有限公司 51260 | 代理人: | 邢伟 |
地址: | 610000 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 山地 环境 智能 体协 搜索 节能 方法 | ||
本发明公开了一种用于山地环境下的多智能体协同搜索节能方法,包括以下步骤:S1.确定智能体的特性参数;S2.进行导航目标选择,获得下一个要遍历的目标位置;S3.构建运动学模型,控制智能体从当前位置运动到目标位置。本发明通过深度强化学习选择导航目标点,并鼓励智能体沿等高线方向在导航目标点之间移动,通过深度强化学习模型,智能体可以自己进行学习,选择最优路径以减少重复覆盖和能量消耗。
技术领域
本发明涉及多智能体协同搜索,特别是涉及一种用于山地环境下的多智能体协同搜索节能方法。
背景技术
利用多智能体搜索感兴趣区域的算法已经比较成熟。多智能体主要被用于搜索不平坦的地形,但现有的搜索算法都是针对平坦地形设计的,因此多智能体在导航目标之间的移动往往采用最短路径方式移动。在不平坦的地形上使用最短路径移动会消耗更多的能量。目前智能体基本是使用便携式能源供电,如果智能体移动过程中消耗的能量过多,可能会导致不能完成搜索任务。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于山地环境下的多智能体协同搜索节能方法,通过深度强化学习选择导航目标点,并鼓励智能体沿等高线方向在导航目标点之间移动,通过深度强化学习模型,智能体可以自己进行学习,选择最优路径以减少重复覆盖和能量消耗。
本发明的目的是通过以下技术方案来实现的:一种用于山地环境下的多智能体协同搜索节能方法,包括以下步骤:
S1.确定智能体的特性参数;
S2.进行导航目标选择,获得下一个要遍历的目标位置;
S3.构建运动学模型,控制智能体从当前位置运动到目标位置。
所述步骤S1智能体的特性参数包括智能体的数量为N、智能体的搜索半径rs以及智能体之间的通信半径为rc;其中rs0,rc2rs。
步骤S2中所述的导航目标选择,包括信息地图引入和深度强化学习。所述信息地图引入过程包括:
考虑到智能体由于功率约束,所能克服的最大倾角有限,假设能克服的最大倾角为60度,遍历的区域在x-y平面的投影为m*n的矩形,将该区域划分成k*l个小矩形区域,k和l的定义如下:
将矩形的中心点看做是一个引导点γx,y坐标用(x,y)表示;整个搜索区域就看作是记录所有引导点γ的一张信息地图;
智能体i的信息地图Mi(γ)存储着其区域覆盖的历史信息,表示为Mi(γ)=γx,y(x,y=1,2,...,m),其值为0或1:若智能体i没有遍历过引导点γ所在位置,则记mi(γ)=0,否则记mi(γ)=1,如果智能体之间的距离小于智能体之间的通信半径rc,那么它们会进行信息交互,更新彼此的信息地图更新公式如下:
mi(γx,y)=max(ms(γx,y)).
ms(γ(x,y))表示通信范围内其他智能体的信息地图数据。
所述深度强化学习过程包括:
针对山地的搜索遍历,引入信息地图之后,就转换为遍历完整个信息地图的γ点;为了提高遍历效率,减少重覆盖,采用深度强化学习,让智能体自己去选择下一个最优的γ点进行遍历;所述深度强化学习就是让智能体与外界环境进行交互,智能体通过采取行为改变自身状态并获得一定奖励,经过网络的训练之会得到一个深度强化学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210177844.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗摔老耐高温水刺无纺布及生产设备
- 下一篇:显示设备及音效处理方法