[发明专利]一种基于深度学习的数据中心网络流量拼接方法有效
申请号: | 202010534449.1 | 申请日: | 2020-06-12 |
公开(公告)号: | CN111817971B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 东方;夏鸣轩;王士琦 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04L47/10 | 分类号: | H04L47/10;H04L47/125;G06N3/0464;G06N3/048 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 郑晓玉 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 数据中心 网络流量 拼接 方法 | ||
1.一种基于深度学习的数据中心网络流量拼接方法,其特征在于,包括以下步骤:
(1)初始化网络流量拼接的孪生神经网络模型;
(2)根据一段时间内采集到的流量信息,选择具有代表性的流量特征表征网络流量,形成样本,利用该样本训练步骤(1)中初始化的孪生神经网络模型;
(3)在进行流量拼接时,对需要拼接的流量提取步骤(2)选择的流量特征,其中,所述需要拼接的流量包括多个流量对,所述流量对包括进入节点的流量和离开节点的流量;
将每个所述流量对包括的进入节点的流量和离开节点的流量的流量特征,输入所述孪生神经网络模型中,得到所述流量对对应的匹配概率值;
对匹配概率值大于模型判定阈值的流量对进行流量拼接。
2.根据权利要求1所述基于深度学习的数据中心网络流量拼接方法,其特征在于,步骤(1)的具体过程如下:
(11)使用数据中心网络流量的流量信息构成流量特征向量,用以表征数据中心网络流量,所述流量信息包括IP地址、端口号、数据包大小和流量持续时间;
(12)初始化孪生神经网络模型的参数,包括每批输入的样本对数目、学习率、正反样本对比例和各层神经网络参数;
(13)设置模型判定阈值η,作为最终流量拼接判定标准。
3.根据权利要求1所述基于深度学习的数据中心网络流量拼接方法,其特征在于,步骤(2)的具体过程如下:
(21)采集数据中心网络中的流量信息,构成流量特征向量;
(22)使用多准则的特征选择算法从流量特征向量中选择具有全局代表性和鲁棒性的流量特征;
(23)对步骤(22)选择出的流量特征进行注入注意力处理;
(24)将步骤(23)处理之后的流量特征输入孪生神经网络进行训练;
(25)重复步骤(23)-(24),直至模型收敛。
4.根据权利要求3所述基于深度学习的数据中心网络流量拼接方法,其特征在于,步骤(22)的具体步骤如下:
(221)计算流量特征的三个准则:相关性、前后不变性和一致性;
两个特征之间的相关性的计算式如下:
上式中,fi和fj为第i个流量特征和第j个流量特征,var(fi)和var(fj)为特征fi和fj的方差函数,cov(fi,fj)为协方差函数,R(fi,fj)表示特征fi和fj之间的相关程度;则有特征子集S,其相关性R(S)的计算式如下:
上式中,k为特征子集S的维数;
特征的前后不变性的计算式如下:
上式中,U(fi)表示第i个特征fi的前后不变性,fij表示第i个特征的第j个样本值,N为数据集的样本数目,diff(fij)为距离函数,diff(fij)=||fin-fout||2,fin表示第j条流量的第i个特征进入节点时流量特征值,fout表示第j条流量的第i个特征离开节点时流量特征值;则有特征子集S,其前后不变性U(S):
特征子集S的一致性C(S)的计算式如下:
上式中,M(fi=K)为数据样本中第i个特征fi为K的样本数目,K为数据样本中第i个特征相同值最多的特征值;
(222)根据步骤(221)的三个准则,对特征子集进行综合评分,根据评分选出最优的特征子集:
上式中,G(S)为综合评分,softmax(x)为使x归一化到[0,1]之间的函数;
(223)根据步骤(222)的结果从原始流量特征向量中提取出特征子集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010534449.1/1.html,转载请声明来源钻瓜专利网。