[发明专利]对手策略反演方法、系统、装置有效
申请号: | 202011586486.3 | 申请日: | 2020-12-29 |
公开(公告)号: | CN112529110B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 范国梁 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321;G06N3/047;G06N3/08;G06Q10/04 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对手 策略 反演 方法 系统 装置 | ||
本发明属于决策推演领域,具体涉及一种对手策略反演方法、系统、装置,旨在解决现有的策略反演方法无法有效的估计对手的意图以及自适应性较差的问题。本方法包括实时获取在可见范围内对抗方各智能体的状态信息,作为输入信息;基于输入信息,结合预获取的第一概率,通过深度置信网络模型获取所述对抗方各智能体前进路线对应的后验预测概率;对所述对抗方各智能体,根据其速度,结合后验预测概率最大的前进路线,计算其对应的预测机动位置;第一概率为对抗方各智能体的时空运动轨迹经过关键地点的先验概率。本发明可有效的估计对手的意图,提升了智能体博弈对抗的能力以及自适应性。
技术领域
本发明属于决策推演领域,具体涉及一种对手策略反演方法、系统、装置。
背景技术
多智能体博弈具有实时对抗、群体协作、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题。同时该领域研究成果在社会管理、智能交通、经济、军事等领域有广阔的应用前景。博弈中态势评估是首要关节。目前态势评估的模型有很多种,但最常用的应属Endsley三层态势评估模型。Endsley认为态势评估是决策者在一定的时间和空间内,对周围环境中要素含义的理解,以及对它们未来状态的改变进行预测,是决策者的理解过程。于是,他从人的认知角度,根据人的思维过程,把态势评估分为态势感知、态势理解和态势预测三个层面。1)态势感知,即指挥员通过多渠道对战场环境信息进行获取,如战场环境、兵力部署、作战企图/作战目标等。2)态势理解,即对所感知的信息因素结合战场环境给予深层次认识和理解。3)态势预测,即根据态势感知和理解的结果,采取相应行动后,对未来事件发展变化的一种预测。
在态势评估中难度最大的是态势预测,需要对未来行为估计和探索,特别是在博弈对抗过程,需要对对手策略和意图进行估计反演,这成为博弈对抗成功的关键所在。而现有的策略反演方法却无法有效的估计对手的意图。
另外,分布式多智能体对抗是为了实现单一目标而从预先定义的分布式系统协议迁移而来的。经典设计有一个规定的目标,然后使用自顶向下的设计方法来分散操作。例如,整个战场的操作者首先在全局范围内为代理设计最优策略,然后根据代理的局部信息通知每个代理如何行动。然而,当一个代理离开修改系统的战场时,先前设计的策略不再是全局最优的。因此,在自上而下的设计中,一件作品的丢失将失去整个效果。在这种方法中,代理被编程成离线的设计方式,从而失去自适应性。
发明内容
为了解决现有技术中的上述问题,即为了解决的现有的策略反演方法无法有效的估计对手的意图以及自适应性较差的问题,本发明第一方面,提出了一种对手策略反演方法,该方法包括:
步骤S10,实时获取在可见范围内对抗方各智能体的状态信息,作为输入信息;所述状态信息包括ID、时空运动轨迹、机动状态、速度;
步骤S20,基于所述输入信息,结合预获取的第一概率,通过深度置信网络模型获取所述对抗方各智能体前进路线对应的后验预测概率;
步骤S30,对所述对抗方各智能体,根据其速度,结合后验预测概率最大的前进路线,计算其对应的预测机动位置;
其中,所述第一概率为对抗方各智能体的时空运动轨迹经过关键地点的先验概率。
在一些优选的实施方式中,所述第一概率,其获取方法为:
步骤A10,采集对抗方各智能体的历史状态信息;
步骤A20,通过预设的密度聚类算法按时序对所述历史状态信息进行轨迹聚类;聚类后,将轨迹点的数量大于设定数量阈值的类对应的轨迹点作为关键地点;
步骤A30,计算对抗方各智能体的历史时空运动轨迹经过关键地点的先验概率,作为第一概率。
在一些优选的实施方式中,步骤A20中“通过预设的密度聚类算法按时序对所述历史状态信息进行轨迹聚类”,其方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011586486.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种绸布字牌及其制备方法
- 下一篇:一种ppt文档的对比方法