[发明专利]基于分层决策机制的多机器人协作方法有效
申请号: | 201410274560.6 | 申请日: | 2014-06-18 |
公开(公告)号: | CN104063541B | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 梁志伟;沈萍;刘娟 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50 |
代理公司: | 南京正联知识产权代理有限公司32243 | 代理人: | 王素琴 |
地址: | 210023 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分层 决策 机制 机器人 协作 方法 | ||
技术领域
本发明涉及一种基于分层决策机制的多机器人协作方法。
背景技术
现今国际上最具影响力的FIRA(Federation of International Robot-soccer Association,国际机器人足球联合会)和RoboCup两大机器世界杯人足球赛,两者最大的区别是FIRA是允许一支球队采用传统的集中控制方式,相当于一支球队中的全体队友受同一个大脑的控制。而RoboCup则必须要求采用分布式控制方式,相当于每个队员有自己的大脑,因而是一个独立的“主体”。这就需要对MAS进行深入地研究,让多个智能体规划以合作和竞争的方式去完成一定的目标任务,使用演化算法和群体智慧以达到一个整体的突破性行为目标。
在RoboCup3D仿真比赛中,要想赢得一场足球比赛,单靠个人能力是不可能的,必须有全部队员的相互配合与协作,而且RoboCup3D仿真比赛主要是体现多智能体在复杂动态的环境下如何实现高效地协作和顽强地对抗。RoboCup3D仿真环境的球员人数从2010年的6个智能体变化至2011年的9个人到至今的11个智能体,这对于多智能体的配合提出了更高的要求。
关于多机器人的协作机制问题,最近几年国内外都已开始不同程度的探究。例如葡萄牙的FC Portugal针对球员角色分配问题,采用重复性最优分配(IOA,Iterated Optimal Assignment)方法,是基于著名的贪婪算法下寻求受限的最优值,并结合角色交换机制;观察人类的足球运动,有人提出希望通过建立模仿学习机制,统和人类复杂行为与机器人动作,然而鉴于模仿学习的基础框架的未知性,交互接口也很难获得;美国UT Austin Villa队伍应用子任务集优化方法完成目标框架的设计,使用动态角色分配算法协调整体队伍的占位配合;英国BoldHearts队伍使用联盟算法,旨在构建一个强大的联盟团队满足外界环境的要求,能够按照算法优化其动作参数,同时采用无梯度的Infotaxis策略搜索算法,局部最大化信息增益的速率值;美国的Robocanes队采用基于时空模型匹配方法,以建立相关的运动模型和其内部状态,同时参照德国B-Human队伍的行走引擎机制,并用遗传算法和SARSA学习算法优化不同行为动作参数配置。
上述方法都需要一定的优化机制和学习方法,针对角色分配问题,其计算量大,更新速度慢。上述问题是在多机器人协作过程中应当予以考虑并解决的问题。
发明内容
本发明的目的是提供一种基于分层决策机制的多机器人协作方法,实现整个多机器人团队的有效协作,依次实现前锋持球者的选择和其它所有球员角色的分配,同时针对前锋持球者带球决策模块建立DOBMP模型,最后采用动态规划算法优化角色函数所带来的高维数计算量的问题,保证基于足球位置不断变化下的角色轮换的流畅性。
本发明的技术解决方案是:
一种基于分层决策机制的多机器人协作方法,
球员依据球的位置判断进行阵型选择去应对比赛;
接着所有球员投票选出自己认为此时最佳的持球者前锋持球者,再进行其它角色分配;
判断是否为前锋持球者,如果是前锋持球者,则行走至球处,带球行走,使用理想行为预测模型对对手速度进行数学建模用于前锋持球者行走踢球决策模块,即是将球踢至目标点还是行走带球至目标点;
如果不是前锋持球者,则进行其他角色分配后,行走至位置点,进行阵型选择。
进一步地,使用理想行为预测模型对对手速度进行数学建模用于前锋持球者行走踢球决策模块,具体为:
由对手的平均速度和其当前所在的位置,计算出对手到达球位置所需要花费的时间T;同时知道我方球员执行踢球动作所花费的时间,设定阈值以预测我方机器人能否成功将球踢至目标点;
假设对手可以在t时间内阻止我方踢球,当T-t值越小,我方成功完成踢球任务的可能性越大;
当T-t的值小于设定的阈值时,就认为踢球任务可以成功完成,此时采取将球踢至目标点。
进一步地,在做出决策后对手仍可以阻止我方踢球,更改建立的对手的瞬时速度表,也就是,如果我方未能完成踢球任务就要对速度表设置惩罚值p:
其中,Verr是对手的真实速度与平均速度之差,n是采样的瞬时速度的个数。
进一步地,使用动态规划函数优化算法来减少计算量:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410274560.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种防摔水杯
- 下一篇:一种新型半导体元器件拆卸治具