[发明专利]一种基于深度强化学习的数据中心网络负载均衡方法有效

专利信息
申请号: 202011192183.3 申请日: 2020-10-30
公开(公告)号: CN112437020B 公开(公告)日: 2022-06-24
发明(设计)人: 郭得科;刘源;李克秋 申请(专利权)人: 天津大学
主分类号: H04L47/125 分类号: H04L47/125;G06N3/04;G06N3/08;H04L45/24
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 李素兰
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 深度 强化 学习 数据中心 网络 负载 均衡 方法
【权利要求书】:

1.一种基于深度强化学习的数据中心网络负载均衡方法,其特征在于,该方法具体包括以下流程:

步骤1:搭建虚拟的网络拓扑结构环境;

步骤2:构建以及初始化Actor网络Critic网络目标Actor网络和目标Critic网络状态st,定义为在时间t新到达的流的集合未完成的流的集合和已经完成流的集合将动作at定义为n条链路的权重

步骤3:每隔一段时间将网络中的流的信息作为st输入到步骤2构建的四个神经网络包括Actor网络Critic网络目标Actor网络和目标Critic网络中,进行链路权重优化问题的DDPG训练,直到达到网络的FCT理想值,即四个神经网络模型收敛,利用深度强化学习的训练目标最大化累计奖励的期望,最后从DNN中提取决策树;θQ表示Critic网络的参数,θπ表示Actor网络的参数,θQ′表示目标Critic网络的参数,θπ′表示目标Actor网络的参数;

计算已完成的流的奖励函数rt,如式(1)所示:

其中,rt表示在时间t的奖励值,也就是两个连续时间间隔的平均吞吐量之间的比率;dff表示已完成的流f的吞吐量,df和τf分别表示流f的大小和流完成时间FCT。

2.如权利要求1所述的一种基于深度强化学习的数据中心网络负载均衡方法,其特征在于,所述步骤3中的链路权重优化问题的DDPG训练过程的一个更新过程,具体包括以下步骤:

首先,Actor网络根据当前状态st输出动作at,当前状态st即在时间t新到达的流的集合未完成的流的集合和已经完成流的集合该动作会影响环境并导致新的状态St+1并收到奖励rt;其次,将映射(st,at,rt,St+1)存储在经验回放池中,然后从中对数据进行批次采样;对于每个样本,用目标Critic网络和目标Actor网络计算目标值yi;通过yi与Critic网络计算出梯度该梯度用于更新Critic网络的参数θQ;用更新后的Critic网络和Actor网络计算梯度来更新Actor网络的参数θπ;最后,更新目标Critic网络θπ′和目标Actor网络的参数θπ′,进行下一次迭代。

3.如权利要求1所述的一种基于深度强化学习的数据中心网络负载均衡方法,其特征在于,所述步骤3中的从DNN中提取决策树的过程,具体包括以下步骤:

步骤3-1:初始化用于决策树训练的数据集,在与训练DRL智能体相同的虚拟环境中,DRL智能体与虚拟环境反复交互以收集多个轨迹,来生成初始数据集,轨迹中的状态-动作对被初始化为(S,A);

步骤3-2:判断决策树是否收敛:若收敛,跳到第3-9步,否则进入步骤3-3;

步骤3-3:用(S,A)中的所有样本初始化生成一个单根树

步骤3-4:判断是否达到结束条件,判断决策树的叶节点数达到最大阈值或所有样本Gini指数都等于0;如果达到结束条件,则跳到步骤3-7,否则进入步骤3-5;

步骤3-5:计算树中的每个叶节点的Gini指数增益如式(2)所示:

式中,N表示节点n的样本数,ai表示第i个样本的动作值,表示在状态si下DNN策略预测的值,即ai=π(si),表示在状态si下决策树预测的值,即Φn=0表示节点n上的所有样本都具有相同的动作;Φn越大,表示当前节点中的样本方差越高,在这种情况下,该节点上的样本需要进行拆分并进一步分类;

计算决策树中的每个叶节点的Gini指数增益如式(3)所示:

其中,n1和n2表示根据与第μ个特征关联的第v个分割点的子节点,N1和N2分别表示n1和n2的样本数;

步骤3-6:分割使Gini指数增益最大的叶节点,并更新决策树返回步骤3-4;

步骤3-7:得到决策树后,在虚拟环境中运行决策树智能体收集新的状态-动作对集合(S′,A′);

步骤3-8:将决策树经历的状态反馈给DNN,并获得动作整合决策树的状态和DRL的行为,得到重新采样的数据集(S′,A*),将数据集(S′,A*)与当前数据集(S,A)进行汇总,回到步骤3-3;

步骤3-9:部署最后一次迭代生成的决策树,用于在线的链路权重决策,以指导终端主机在可用路径之间分配流量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011192183.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top