[发明专利]一种基于Sarsa的SDN数据中心拥塞控制方法有效

申请号：	201711173239.9	申请日：	2017-11-22
公开（公告）号：	CN107864102B	公开（公告）日：	2020-09-04
发明（设计）人：	金蓉;王伟明;李姣姣;庹鑫	申请（专利权）人：	浙江工商大学
主分类号：	H04L12/825	分类号：	H04L12/825
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	傅朝栋;张法高
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于Sarsa的SDN数据中心拥塞控制方法。本发明方法基于SDN的网络背景，提出一种基于流的拥塞控制思想，引入增强学习中的Sarsa算法，根据数据中心网络链路的负载变化，实时智能地全局分配流的速率，使整个网络避免拥塞的前提下，链路利用率尽可能高，从而实现整个数据中心的拥塞控制。本发明提出改进的Sarsa算法，对Q矩阵进行训练；再根据流的请求，利用训练得到的Q矩阵，进行速率分配，从而实现拥塞控制。本发明提供了一种控制效果较好，控制算法易实现，低时延以及能实时地自适应的SDN数据中心拥塞控制方法。本发明为SDN数据中心的拥塞控制问题提出了一种基于增强学习Sarsa算法的智能解决方法。
搜索关键词：	一种基于 sarsa sdn 数据中心拥塞控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于Sarsa的SDN数据中心拥塞控制方法，其特征在于，包含如下步骤：步骤1：将Sarsa算法引入基于软件定义网络的数据中心；步骤2：基于改进的Sarsa算法，对Q矩阵进行训练；具体包含如下子步骤：2‑1.按照先验知识，给定奖励矩阵R，并将Q矩阵初始化；2‑2.改进Sarsa算法中选取action的方法，使算法结合当前状态以及当前flow所经过的链路两个条件，在R矩阵中选择最大奖励对应的action；同时，采取ε‑greedy策略保证Sarsa学习算法的收敛性；2‑3.执行所选择的action，观察reward和新的链路状态，根据Q(S,a)←Q(S,a)+α[r+γQ(S',a')‑Q(S,a)]迭代更新值函数Q(S,a)；其中S表示当前状态；a表示当前状态下选择的动作；S'和a'则分别表示后续的状态和动作；迭代更新值函数Q(S,a)表示当前状态s下执行动作a后的Q值，Q(S',a')表示下一状态S'下执行动作a'后的Q值，r是当前状态S下执行动作a后的奖励，γ为折扣因子，α为学习效率；2‑4.循环执行Q矩阵训练过程，直到s为最终状态，得到训练后的Q矩阵；步骤3：根据具体的flow请求，结合上述步骤2得到的经过训练得到的Q矩阵和最终策略，对SDN数据中心网络进行拥塞控制。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工商大学，未经浙江工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711173239.9/，转载请声明来源钻瓜专利网。

上一篇：负载均衡方法和装置
下一篇：改进的MUSIC算法散射簇模型信道参数估计方法

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于Sarsa的SDN数据中心拥塞控制方法有效

专利文献下载