[发明专利]基于强化学习的兵棋多实体异步协同决策方法和装置有效
申请号: | 202210782446.9 | 申请日: | 2022-07-05 |
公开(公告)号: | CN114880955B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 张煜;蒋超远;罗俊仁;李婷婷;刘运;杨景照;刘果;李鑫;刘屹峰;陈佳星 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/00;G06N3/04;G06N3/08;G06N20/00 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 彭小兰 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本申请属于智能决策技术领域,涉及基于强化学习的兵棋多实体异步协同决策方法和装置,方法包括:获取兵棋推演环境以及多实体异步协同决策问题,对多实体异步协同决策问题进行建模分析,得到初始模型;根据初始模型,采用多智能体深度强化学习算法,建立智能体网络模型和混合评估网络模型;对智能体网络模型和混合评估网络模型进行训练,得到协同决策框架;通过设置加权算子或通过多步回报优化多智能体深度强化学习算法,重构多智能体深度强化学习算法的损失函数;采用重构的损失函数更新协同决策框架;根据更新后的协同决策框架,对多实体的异步协同进行决策。本申请能够实现兵棋推演中多实体异步协同的决策。 | ||
搜索关键词: | 基于 强化 学习 兵棋多 实体 异步 协同 决策 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210782446.9/,转载请声明来源钻瓜专利网。