[发明专利]一种处理通信延迟的多智能体强化学习方法在审
申请号: | 202310571611.0 | 申请日: | 2023-05-21 |
公开(公告)号: | CN116595373A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 曹向辉;梅建国 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06N3/0442;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 杜静静 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种处理通信延迟的多智能体强化学习方法,其特点是该方法采用基于通信的多智能体强化学习方法,使用通信缓存池代替延迟信息以及以Transformer为通信特征提取网络进行信息特征提取,再结合硬注意力机制、软注意力机制进一步完成信息整合,最终根据整合信息完成动作决策。本发明与现有技术相比更好地解决了多智能体通信过程中存在通信延迟问题,实现对延迟具有鲁棒性的通信协议,减轻通信延迟对于智能体决策的影响,实现在通信延迟情况下高效完成任务,使得多智能体强化学习能够应用于具有更强的现实通信约束的任务场景。 | ||
搜索关键词: | 一种 处理 通信 延迟 智能 强化 学习方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310571611.0/,转载请声明来源钻瓜专利网。