[发明专利]一种多智能体强化学习方法及系统在审
申请号: | 202110863643.9 | 申请日: | 2021-07-29 |
公开(公告)号: | CN113592100A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 李厚强;周文罡;赵鉴;胡迅晗 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 北京凯特来知识产权代理有限公司 11260 | 代理人: | 郑立明;韩珂 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多智能体强化学习方法及系统,设计了中心化教师模块与去中心化学生模块的多智能体强化学习框架,在满足中心化训练和去中心化执行的条件的基础上,解耦了解决奖励分配和局部观测问题的模块,使得模型训练效率提升。此外,该框架具有普适性,即它可以用于一切基于中心化训练去中心化执行范式提出来的方法。同时,基于本发明上述方案,在主流的合作多智能体强化学习环境星际争霸2中进行实验,实验结果表明本发明上述方案在性能和训练效率上都超过了现有方法。 | ||
搜索关键词: | 一种 智能 强化 学习方法 系统 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202110863643.9/,转载请声明来源钻瓜专利网。
- 上一篇:显示设备和声音产生器
- 下一篇:语音合成方法、装置、设备及可读存储介质