[发明专利]一种基于深度强化学习的多智能体协作模型有效

申请号：	202110930777.8	申请日：	2021-08-13
公开（公告）号：	CN113592101B	公开（公告）日：	2023-10-17
发明（设计）人：	邹启杰;蒋亚军;高兵;秦静;李丹;李文雪	申请（专利权）人：	大连大学
主分类号：	G06N20/00	分类号：	G06N20/00
代理公司：	大连智高专利事务所(特殊普通合伙) 21235	代理人：	毕进
地址：	116622 辽宁省***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于深度强化学习的多智能体协作模型，包括集中式的Critic网络、分散式的多个Actor网络、Q值分解网络，每个所述Actor网络与环境交互产生状态‑动作信息存入经验缓冲区中，Critic网络从所述经验缓冲区中采样，将所有状态‑动作信息作为输入，以协作多智能体系统的任务为目标设计全局奖励R，采用TD误差的方式学习得到一个全局动作价值Qtot；Q值分解网络将所述全局动作价值Qtot分解为基于单个智能体的动作价值Qi，每个Actor网络的梯度更新依赖分解后对应的单个智能体的动作价值Qi。本发明保证了全局最优动作与局部最优动作的一致性，从而提高多智能体在连续动作空间的探索效率。
搜索关键词：	一种基于深度强化学习智能体协模型
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于大连大学，未经大连大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202110930777.8/，转载请声明来源钻瓜专利网。

专利分类

免登录下载普通用户下载升级VIP会员，免费下载

专利文献下载