[发明专利]基于多机制组合策略的集群分布式抓捕方法在审
申请号: | 202210256828.8 | 申请日: | 2022-03-16 |
公开(公告)号: | CN114692397A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 杨严杰;何流;成慧;范正平 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06N3/00;G06F111/06 |
代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 梁嘉琦 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 机制 组合 策略 集群 分布式 抓捕 方法 | ||
本发明公开了一种基于多机制组合策略的集群分布式抓捕方法,包括构建追捕者与逃逸者的对抗场景和运动学模型,根据对抗场景和运动学模型构建追捕者多机制抓捕策略,根据追捕者多机制抓捕策略构建多目标优化函数,引入层次分析法为多目标优化函数分配权重,使用粒子群算法对多目标优化函数进行求解,以求解结果作为追捕者的策略输出等步骤。本发明具有简单鲜明的行为策略,无需复杂的建模推导,算法简便,无需复杂的超参数调参和长时间训练过程,具备快速部署能力;在通信和处理能力受限的情况下,可发挥优于集中式控制的任务能力;所构建模型在粒子群算法的解算下,求解速度较快,可满足实时性需求。本发明广泛应用于智能体追逃控制技术领域。
技术领域
本发明涉及智能体追逃控制技术领域,尤其是一种基于多机制组合策略的集群分布式抓捕方法。
背景技术
无人机群搜救任务、污染目标物清理任务、导弹或卫星拦截任务等任务都可以对应追逃模型,例如无人机群搜救任务中的无人机相当于追捕者,被搜救对象相当于逃逸者,被拦截的导弹或卫星相当于逃逸者,被发射出去用来拦截的导弹相当于追捕者,因此设计良好的追捕或抓捕算法,有利于提高任务的完成效率,例如提高无人机群搜救效率、污染目标物清理效率以及导弹或卫星拦截效率。
目前对追逃问题的研究大部分集中于少数一两个个体,但是现实当中的追逃问题一般包含多个个体,例如派出多个无人机搜救失踪人员等等,就涉及多个追捕者和逃逸者,此时追逃问题的研究容易陷入多维陷阱,现有技术较难求解相应的解析对策。
目前,动态规划、梯度算法、强化学习等方法被用于获取多个体追逃问题的数值解或近似解,而基于强化学习的方法在追逃问题的研究中逐渐受到关注,利用诸如深度Q网络(Deep Q-network,DQN)、模糊演员-评论家学习(Fuzzy actor critic learning,FACL)、深度确定性策略梯度(Deep deterministic policy gradient,DDPG)和双延迟深层确定性策略梯度(Twin delayed deep deterministic policy gradient,TD3)等算法让智能体学习到高收益的策略。但是,应用上述与人工智能相关的技术将面临复杂的建模推导、超参数调参以及长时间的训练过程,对数据处理能力以及通信时延和带宽等硬件性能要求很高,因此容易出现实时性差、部署慢等问题。
发明内容
针对目前的追逃问题求解技术实时性差、部署慢等至少一个技术问题,本发明的目的在于提供一种基于多机制组合策略的集群分布式抓捕方法,包括以下步骤:
构建追捕者与逃逸者的对抗场景;所述追捕者与所述逃逸者均为智能体;
建立所述追捕者与所述逃逸者的运动学模型;
根据所述对抗场景和所述运动学模型,构建追捕者多机制抓捕策略;
根据所述追捕者多机制抓捕策略,构建多目标优化函数,引入层次分析法为所述多目标优化函数分配权重;
使用粒子群算法对所述多目标优化函数进行求解,以求解结果作为所述追捕者的策略输出。
进一步地,所述基于多机制组合策略的集群分布式抓捕方法还包括:
通过人工势场法,构建逃逸者最优化模型;
使用粒子群算法对所述逃逸者最优化模型进行求解,以求解结果作为所述逃逸者的策略输出。
进一步地,所述对抗场景包括:
追捕者Pi,i=1,2,3,...,N,逃逸者E,起始点(xstart,ystart),目标点(xtarget,ytarget)和对抗区域ΩA;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210256828.8/2.html,转载请声明来源钻瓜专利网。