[发明专利]基于多智能体强化学习路由策略控制路由动作的方法有效

申请号：	202010199453.7	申请日：	2020-03-20
公开（公告）号：	CN111416771B	公开（公告）日：	2022-02-25
发明（设计）人：	陈怿;曾思亮;许行飞	申请（专利权）人：	深圳市大数据研究院;香港中文大学（深圳）
主分类号：	H04L45/00	分类号：	H04L45/00;H04L45/02;H04L45/037;H04L45/30
代理公司：	北京智信四方知识产权代理有限公司 11519	代理人：	刘真
地址：	518172 广东省深圳市龙岗***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及信息技术领域，公开了一种基于多智能体强化学习路由策略控制路由动作的方法，包括：训练强化学习模型，所述强化学习模型利用Q学习算法更新路由节点的决策值，并结合更新的所述决策值利用策略梯度算法更新策略参数；根据所述路由节点转发数据包的目标节点以及所述路由节点所在通讯网络中的网络负载，利用所述强化学习模型确定策略参数；根据所述策略参数，确定所述路由节点的传出链接。本发明针对动态变化的网络连接的模式和网络负载，路由节点都能及时调整路由策略，根据数据包的目标节点选择合适的最短路径，最终大大减少了数据包的平均递送时间。
搜索关键词：	基于智能强化学习路由策略控制动作方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

暂无信息

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市大数据研究院;香港中文大学（深圳），未经深圳市大数据研究院;香港中文大学（深圳）许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/202010199453.7/，转载请声明来源钻瓜专利网。

上一篇：一种基于滑动窗递推主元分析的自适应工业过程监测方法
下一篇：一种基于TrustZone的视网膜识别方法

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于多智能体强化学习路由策略控制路由动作的方法有效

专利文献下载