[发明专利]基于扩展式合作博弈的多机器人围捕目标方法有效
申请号: | 201510178542.2 | 申请日: | 2015-04-16 |
公开(公告)号: | CN104942807B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 李敏;曹金阁;李洋;窦连航 | 申请(专利权)人: | 上海大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G06F19/00;G06F17/50 |
代理公司: | 上海上大专利事务所(普通合伙)31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于扩展式合作博弈的多机器人围捕目标方法,包括如下步骤步骤一对多机器人围捕的扩展式合作博弈模型进行数学建模;步骤二制定机器人的运行策略;步骤三围捕任务执行过程的制定;本发明使得围捕机器人在执行任务过程中可以有更加灵活的位置,它们可以快速的追赶目标,追赶过程中可以躲避障碍物和同伴,最后围堵在目标机器人周围,使得目标机器人无法从包围圈中逃脱。 | ||
搜索关键词: | 基于 扩展 合作 博弈 机器人 围捕 目标 方法 | ||
【主权项】:
一种基于扩展式合作博弈的多机器人围捕目标方法, 其特征在于,具体包括如下步骤:步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模:围捕机器人:多机器人群体协作系统中机器人集合为:;表示的是系统中的围捕机器人i;目标机器人只有一个为Target;行动集:轮到行动时,可以选择的所有行动的集合被称为行动集,记为;通过对本发明行动策略的分析和简化得到以下的行动集:TT 策略表示围捕机器人朝目标机器人方向运动一步;TL策略表示围捕机器人沿左侧最小避碰方向角运动一步;TR策略表示围捕机器人沿右侧最小避碰方向角运动一步;策略集Move中的策略分别指朝目标机器人左侧、右侧方向运动和朝目标机器人方向运动;是具有较高碰撞危险度的机器人和之间的最小避碰方向角,与为最小避碰距离,代表机器人和之间的距离;公式表示为:围捕者运动方向与环境x轴的夹角为,此为围捕者的运动方向角;那么可以得到三种运动策略的运动公式如下:TT:TL:TR:阶段和行动顺序:在扩展式合作博弈中,围捕者是按照一定的规则按照顺序进行运动,每次运动称为一个阶段;本发明要求每个阶段仅有一个围捕者进行运动,因此阶段数是由参与博弈的围捕者的数量决定;围捕机器人运行角度的计算方法:a、b、c分别为围捕者、目标前一位置和现在位置组成三角形的三个边,围捕者与目标的连线是围捕者此时的运动方向,计算公式为如下:围捕者与目标之间的距离为,为目标的坐标位置,()为围捕者坐标位置,的计算公式为:综上所述,约定局中人博弈优先级顺序为如下三式:式中,和分别为机器人的任务、与目标的相对距离和目标角对博弈优先级的影响函数,表示机器人到达目标的有效区域半径,为每一项的权值系数,且;收益函数:在扩展式博弈中,博弈机器人的收益函数是所有个体共用的;在围捕机器人各自采取某种行为策略后,就形成一个局势,所以为了衡量局势的优劣,本发明采用局势评估函数作为收益函数,计算出的评估值作为围捕机器人的收益值;为了描述一个局势对围捕机器人完成目标的贡献大小,步骤二:制定机器人的运行策略:搜索目标机器人策略: 任务初始,如果围捕机器人无法发现目标机器人的位置,此时他们需要进行目标机器人的搜索;目标机器人的扫描范围也是有限的,在没有发现围捕者的情况下,所有的围捕机器人进行漫无目的的行走,围捕机器人之间不进行通信以减少负担,一旦有一个围捕机器人扫描到了目标机器人,不断的用最大的速度来追捕目标机器人,与此同时此围捕机器人会马上发出信号,发送目标机器人的位置信息给其扫描范围之内的围捕机器人,收到信息的围捕机器人也会用最大的速度去追捕目标机器人,并且也会发出目标机器人的位置信息给其他的围捕机器人,最后所有收到目标机器人位置信息的围捕机器人会执行围捕任务;判定围捕任务成功完成:由收益函数得知,围捕机器人在不发生碰撞的情况下,与目标机器人的距离越近收益越大,同时与其他围捕机器人距离越远其收益越大,但是由于是围捕任务,靠近目标比围捕机器人之间的距离更重要,所以在收益函数中靠近目标的收益权值比围捕机器人之间距离权值大,所以围捕机器人优先靠近目标机器人的情况下,再与其他围捕机器人保持最大的安全距离;当围捕机器人群体对目标形成围捕之后,群体几乎是均匀的分配在目标机器人周围;这样就会产生一个问题:围捕机器人群体较少时,相邻机器人之间的距离较大,容许目标机器人安全通过,造成无法完成围捕任务的情况;目标机器人逃脱策略:围捕机器人到达危险区域后,离目标机器人越近的围捕机器人对其影响越大,围捕机器人对目标影响力相加得到矢量,即为目标此时的运动方向;所以目标机器人的逃脱方向的计算公式为如下式:是指运动方向的矢量;是指与Target的距离;步骤三:围捕任务执行过程的制定:机器人分为围捕者与目标,围捕机器人有三个以上的机器人,目标只有一个机器人,所有的机器人都是同构机器人,以方便运行过程中的计算;围捕者快速的靠近目标,然后均匀的围住目标,将目标限制在围捕者组成的圈内,限制目标的运动;整个围捕过程为: 在一个平面空间中随机的产生n个围捕机器人,开始搜寻空间中的目标机器人;机器人的位置信息都是公开化的,围捕机器人根据位置信息和其他围捕机器人的运动方向来确定围捕队伍中动态博弈的顺序;根据动态博弈的顺序,围捕机器人开始了与其他机器人个体的博弈,最终确定自身的运动策略;目标机器人根据围捕机器人的位置信息确定危险情况而选择自身的运动策略;如果目标机器人围捕成功,便将目标押送到相应位置,如果围捕不成功,再次从开始制定围捕运动策略。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510178542.2/,转载请声明来源钻瓜专利网。
- 上一篇:一种智能降噪机器人
- 下一篇:机器人装置和机器人装置的控制方法