[发明专利]基于扩展式合作博弈的多机器人围捕目标方法有效
申请号: | 201510178542.2 | 申请日: | 2015-04-16 |
公开(公告)号: | CN104942807B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 李敏;曹金阁;李洋;窦连航 | 申请(专利权)人: | 上海大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G06F19/00;G06F17/50 |
代理公司: | 上海上大专利事务所(普通合伙)31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 扩展 合作 博弈 机器人 围捕 目标 方法 | ||
技术领域
本发明涉及多机器人协作围捕领域,尤其涉及一种基于扩展式合作博弈的多机器人围捕目标方法。
背景技术
近年来,多机器人协作已经得到了研究者的关注,在社会生活和军事项目中都起到了非常重要的作用。单个机器人现在功能越来越强大,可以完成难度大的任务,但是在单个机器人身上为了完成某种任务而添加功能,这样的成本是巨大的,所以研究者开始探寻其他的方法来弥补单机器人的此项弱点。多机器人系统一般是用成本低并且功能简单的轮式机器人来组成,它不仅可以完成单个机器人所能完成的任务,而且还能显著的提高机器人的工作效率。
多机器人协作围捕是检验多机器人工作效率的有效方法之一。多机器人围捕过程就是利用三个或者三个以上的轮式机器人,首先协作寻找到环境中移动的一个目标机器人,然后通过运动过程中围在目标周围来达到围捕目标的目的,最后目标没有运行的出口后,任务结束。传统的多机器人围捕通常是采用对多机器人队伍进行编队的形式,这种方法必须要求群体形成一个固定的队伍形状。但是这种方法使得机器人的运动不够灵活,每个机器人必须出现在一个固定的位置上来围捕目标。
发明内容
鉴于上述提到的问题,本发明的目的在于提出一种基于扩展式合作博弈的多机器人围捕目标方法。
一种基于扩展式合作博弈的多机器人围捕目标方法, 其特征在于,具体包括如下步骤:
步骤一:对多机器人围捕的扩展式合作博弈模型进行数学建模:
围捕机器人:多机器人群体协作系统中机器人集合为: ;
表示的是系统中的围捕机器人i;目标机器人只有一个为Target;
行动集:轮到行动时,可以选择的所有行动的集合被称为行动集,记为;通过对本发明行动策略的分析和简化得到以下的行动集:
TT 策略表示围捕机器人朝目标机器人方向运动一步;
TL策略表示围捕机器人沿左侧最小避碰方向角运动一步;
TR策略表示围捕机器人沿右侧最小避碰方向角运动一步;
策略集Move中的策略分别指朝目标机器人左侧、右侧方向运动和朝目标机器人方向运动;
是具有较高碰撞危险度的机器人和之间的最小避碰方向角,与为最小避碰距离,代表机器人和之间的距离;公式表示为:
围捕者运动方向与环境x轴的夹角为,此为围捕者的运动方向角;那么可以得到三种运动策略的运动公式如下:
TT:
TL:
TR:
阶段和行动顺序:在扩展式合作博弈中,围捕者是按照一定的规则按照顺序进行运动,每次运动称为一个阶段;本发明要求每个阶段仅有一个围捕者进行运动,因此阶段数是由参与博弈的围捕者的数量决定;
围捕机器人运行角度的计算方法:a、b、c分别为围捕者、目标前一位置和现在位置组成三角形的三个边,围捕者与目标的连线是围捕者此时的运动方向,计算公式为如下:
围捕者与目标之间的距离为,为目标的坐标位置,()为围捕者坐标位置,的计算公式为:
综上所述,约定局中人博弈优先级顺序为如下三式:
式中,和分别为机器人的任务、与目标的相对距离和目标角对博弈优先级的影响函数,表示机器人到达目标的有效区域半径, 为每一项的权值系数,且;
收益函数:在扩展式博弈中,博弈机器人的收益函数是所有个体共用的;在围捕机器人各自采取某种行为策略后,就形成一个局势,所以为了衡量局势的优劣,本发明采用局势评估函数作为收益函数,计算出的评估值作为围捕机器人的收益值;为了描述一个局势对围捕机器人完成目标的贡献大小,
步骤二:制定机器人的运行策略:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510178542.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能降噪机器人
- 下一篇:机器人装置和机器人装置的控制方法