[发明专利]基于强化学习的兵棋多实体异步协同决策方法和装置有效

申请号：	202210782446.9	申请日：	2022-07-05
公开（公告）号：	CN114880955B	公开（公告）日：	2022-09-20
发明（设计）人：	张煜;蒋超远;罗俊仁;李婷婷;刘运;杨景照;刘果;李鑫;刘屹峰;陈佳星	申请（专利权）人：	中国人民解放军国防科技大学
主分类号：	G06F30/27	分类号：	G06F30/27;G06N3/00;G06N3/04;G06N3/08;G06N20/00
代理公司：	长沙国科天河知识产权代理有限公司 43225	代理人：	彭小兰
地址：	410073 湖***	国省代码：	湖南;43
权利要求书：	查看更多	说明书：	查看更多
摘要：	本申请属于智能决策技术领域，涉及基于强化学习的兵棋多实体异步协同决策方法和装置，方法包括：获取兵棋推演环境以及多实体异步协同决策问题，对多实体异步协同决策问题进行建模分析，得到初始模型；根据初始模型，采用多智能体深度强化学习算法，建立智能体网络模型和混合评估网络模型；对智能体网络模型和混合评估网络模型进行训练，得到协同决策框架；通过设置加权算子或通过多步回报优化多智能体深度强化学习算法，重构多智能体深度强化学习算法的损失函数；采用重构的损失函数更新协同决策框架；根据更新后的协同决策框架，对多实体的异步协同进行决策。本申请能够实现兵棋推演中多实体异步协同的决策。
搜索关键词：	基于强化学习兵棋多实体异步协同决策方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学，未经中国人民解放军国防科技大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202210782446.9/，转载请声明来源钻瓜专利网。

上一篇：一种信号分类识别方法
下一篇：一种厌氧发酵与高温裂解资源化利用处置芦苇的方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于强化学习的兵棋多实体异步协同决策方法和装置有效

专利文献下载