[发明专利]一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法有效
申请号: | 201911272386.0 | 申请日: | 2019-12-06 |
公开(公告)号: | CN110989352B | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 丁肇红;吴莹莹;温晓静 | 申请(专利权)人: | 上海应用技术大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 黄超宇;胡晶 |
地址: | 200235 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 蒙特卡洛树 搜索 算法 群体 机器人 协同 方法 | ||
1.一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法,其特征在于,包括以下步骤:
步骤1:参数设置,包括地面移动机器人群体的旅行预算时间阈值,蒙特卡洛树搜索算法的迭代次数;根据地面移动机器人群体的目标监视区域,设定该地面移动机器人群体的n个目标位置;所述地面移动机器人群体包含N个独立运动的地面移动机器人;每台地面移动机器人上搭载有视觉传感器,根据各视觉传感器的感应距离,设定各地面移动机器人的监视半径,将该监视半径作为各目标位置的邻域;
步骤2:为每个地面移动机器人在待探测环境中随机选择一个初始位置,各地面移动机器人基于蒙特卡洛树搜索算法以并行方式得到访问节点序列并进行环境探测,在观测过程中,视觉传感器和激光雷达收集的数据越多则奖励值越高,根据贪婪原则机器人群体形成满足时间约束的访问序列,经过观测后各个地面移动机器人回到各自的初始位置,分别形成相应的闭环轨迹;
所述步骤2是通过以下步骤实现:
步骤21:采用蒙特卡洛树搜索算法的改进方法——上限置信区间树搜索算法,将蒙特卡洛树搜索方法与上限置信区间公式结合,确定每个地面移动机器人个体协同搜索过程中可能的访问节点序列;
步骤22:通过随机概率下降法优化该地面移动机器人访问序列对应的概率分布,利用最大熵原理完成访问序列的概率更新,概率更新公式如下:
其中,x为该地面移动机器人可能的访问序列,qn为访问序列x对应的概率分布,为目标函数f对概率分布qn的期望,H(qn)为概率分布qn的熵;
步骤23:与其他地面移动机器人通信,更新地面移动机器人群体访问序列的联合概率分布,选择概率最高的访问序列中的第一个节点作为该地面移动机器人的下一个访问节点;
步骤24:地面移动机器人运动受最大转弯半径和最大速度限制,结合该运动特征,利用分段Dubins曲线实现地面移动机器人的平滑闭环轨迹规划;
步骤3:不断重复步骤2,直至地面移动机器人群体的时间预算耗尽或达到最大迭代次数,输出地面移动机器人群体的访问节点序列;
步骤4:地面移动机器人群体内的各地面移动机器人同步执行上述各步骤,以此规划出的轨迹使得多地面移动机器人在最短时间内,尽可能多访问目标物体位置,实现快速协同目标搜索任务。
2.根据权利要求1所述的一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法,其特征在于,所述步骤21具体包括以下步骤:
步骤211:在搜索树中选择最佳的拓展节点作为子节点,采用贪婪原则,优先选择未被探索的节点中奖励值最高,即观测信息最多的节点,若所有节点都已经被访问,则选择上限置信区间值最高的节点,上限置信区间计算公式如下:
其中,a为节点编号,t为迭代次数,Nt为该节点被访问的次数,Qt(a)为节点a的奖励估计值;
步骤212:在步骤211选择的子节点处前进一步,随机拓展该节点处的叶节点,该新增节点既不与前面的子节点重复,也不与其他地面移动机器人的搜索树的子节点重复;
步骤213:计算步骤212得到的拓展叶节点序列的最新奖励估计值;
步骤214:在遍历所述蒙特卡罗树中的所有节点之后,采用反向传播方式,根据步骤213的奖励估计值更新搜索树上的对应节点的奖励值;
步骤215:重复步骤211-214,直至所述蒙特卡罗树中至少一个节点的奖励值达到预设阈值,将达到预设阈值的所有奖励值中选择最大奖励值对应的节点作为新的访问节点。
3.根据权利要求1所述的一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法,其特征在于,所述步骤24具体包括以下步骤:
采用的各轮式地面机器人系统的简单运动学模型如下:
其中,xP、yp和θ为机器人底盘当前位姿,V为机器人速度,μ表示转弯速度控制,最大转弯速率对应于某个最小转弯半径,初始和终端切线方向对应于初始和终端坐标。
4.根据权利要求1所述的一种基于蒙特卡洛树搜索算法的群体机器人协同搜索方法,其特征在于,所述步骤3具体包括以下步骤:
设定地面移动机器人群体的航行时间总和T作为目标函数,其表达式如下:
若满足地面移动机器人群体目标函数最小,则返回各地面移动机器人的轨迹曲线,即返回地面移动机器人运行总时间最短所对应的各地面移动机器人路径,各地面移动机器人按照求得的该路径进行目标搜索;其中,χ为机器人的最终轨迹,Xi为机器人的第i条分段Dubins曲线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海应用技术大学,未经上海应用技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911272386.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:电路板装置以及电子设备
- 下一篇:一种真空电水壶壶体结构的制造方法