[发明专利]一种面向分布式网络的流量行为分析方法有效
申请号: | 201810728186.0 | 申请日: | 2018-07-05 |
公开(公告)号: | CN108923975B | 公开(公告)日: | 2021-08-10 |
发明(设计)人: | 马海寿;谢逸;王臻 | 申请(专利权)人: | 中山大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 广州圣理华知识产权代理有限公司 44302 | 代理人: | 顿海舟 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 分布式 网络 流量 行为 分析 方法 | ||
1.一种面向分布式网络的流量行为分析方法,其特征在于,具体为:
模型训练阶段:采集网络历史流量数据作为训练模型的训练数据,得到网络流量行为模型;
学习阶段:将采集的实时流量数据输入训练好的网络流量行为模型,并利用最大后验估计准则经过迭代计算得到网络全局流量行为;
所述模型训练阶段的实现过程具体为:确定网络流量行为模型结构及估计模型参数;
确定网络流量行为模型结构:
将分布式网络流量行为信息分为两层:隐状态层和观测数据层,观测数据层是由网络探针测量得到的网络节点流量数据构成,隐状态层是由网络节点的行为模式构成,表示网络内在驱动因素,直接驱动网络节点流量外在表现;使用随机变量来表示隐状态和观测值,因此隐状态层和观测数据层构成了两个随机场,即隐状态场和观测场;
定义数学符号:在一个拥有N个节点的网络中,¥表示网络节点集合,xt,n∈E表示在第t个时隙的第n个节点,n∈¥,其中表示所有空时位置节点集合,有|E|=|¥|×T,T是时隙数量;使用St,n表示节点xt,n的隐状态变量,st,n∈S表示随机变量St,n的一个实例,其中S代表隐状态集合,则表示定义在E上的隐状态随机变量族;因此,能够使用S表示在[1,T]上的隐状态场,s∈S表示S的一个配置,其中S表示隐状态场所有可能配置集合;使用相似的表示式,Ot,n表示节点xt,n的观测值变量,ot,n∈O表示随机变量Ot,n的一个实例,其中O表示观测值集合,则表示定义在E上的观测值随机变量族;因此,能够使用O表示在[1,T]上的观测场,o∈O表示O的一个配置,其中O表示观测场所有可能配置集合;
使用HMRF模型刻画隐状态场与观测场之间的空时演变关系;
针对隐状态场,引入一个假设:空间上一个节点仅和它的一跳邻居节点的状态有关,时间上仅和它前一个时刻的状态有关;基于统计学习的方法,隐状态场的概率能够通过以下公式获取:
其中,E-{xt,n}表示不包含节点xt,n的网络空时位置节点集合,与分别表示节点xt,n的空间邻居状态与时间邻居状态,λ表示隐状态场参数;
公式(1)中的局部概率,通过以下公式获取:
其中,m表示节点状态,时间转移概率根据时间隐状态转移概率矩阵A计算,A表示隐状态从t时刻到t+1时刻的状态转移概率矩阵,即时间隐状态转移构成一阶马尔科夫链;A矩阵由下式表示:
其中Pij的下标i和j分别表示节点在t和t+1时刻所处的隐状态;空间转移概率通过以下公式获取:
其中,Ut,n(m)表示边缘能量函数,且表示节点xt,n的空间邻居节点,表示节点xt,n的空间邻居节点数量,其中势函数定义为:Vt,n(m)=num·α,其中参数α用于刻画当前节点与其空间邻居节点相互影响关系的强弱,num表示空间邻居节点状态与当前节点状态不相同的数量;
针对观测场,网络节点观测值通过网络探针获得,即网络的观测场是已知数据;设一个节点的观测值只与该节点的状态有关,观测场在隐状态驱动下的输出概率通过以下公式获取:
其中,连乘符号下标(t,n)表示Pr[Ot,n=k|St,n=m,θm]表示t时刻,节点n在状态为m的条件下输出观测值为k的概率,为了方便计算,将观测值Ot,n进行离散化,使用频率来近似代替概率,即使用观测值在状态m的频率分布来近似条件概率,参数θm表示在特定的状态下观测值的分布参数,这里使用输出概率矩阵B表示,称为观测场参数,B矩阵由下式表示:
其中Pmk表示节点在状态m输出观测值为k的概率;
由此,确定网络流量行为模型结构,网络流量行为模型由HMRF模型刻画,因此模型参数为Ω={A,α,B},
估计模型参数;
当采集到历史流量数据以及确定流量行为模型结构之后,利用历史流量数据训练模型参数Ω={A,α,B};为了便于实际工程应用,在计算过程中使用频率近似概率,因此计算之前需要对观测值Ot,n进行离散化;
其训练过程输入历史流量数据o,即网络节点观测值,输出模型参数Ω={A,α,B};估计模型参数流程步骤如下:
(3-1)初始化迭代轮询初始值i、迭代停止条件Iter、初始隐状态场s(1);
其中迭代轮询初始值i初始化为1;迭代停止条件设置为迭代停止次数Iter,根据经验优选设置为5-8次;另外,迭代停止条件也能够设置为前后两次迭代过程参数变化范围阈值,当变化范围小于给定阈值时,停止迭代;初始隐状态场s(1)根据历史流量数据观测值使用聚类算法进行初始化,聚类类别数量根据实际网络监控需求确定,类别数量对应网络节点行为状态数量,因此类别数量反映了对网络流量行为刻画的粒度,行为状态数量越多,能够刻画的流量行为粒度越细;
(3-2)根据隐状态场的配置情况更新模型参数,依据时间状态跳转的频率更新时间隐状态转移概率矩阵A,设时刻t处于状态i时刻t+1转移到状态j的频数记为Aij,那么A中状态转移概率Pij的估计值由以下公式获取:
依据经验公式确定α值,经验值优选0.5-10之间,α越大,表示节点之间相互作用越大,邻居节点的状态对当前节点的状态影响越大,反之亦然;依据相应状态输出观测值的频率分布更新输出概率矩阵B,设样本中状态为m并且观测值为k的频数是Bmk,那么B中输出概率Pmk的估计值由以下公式获取:
同时,迭代轮询次数加1,即i=i+1;
(3-3)判断是否满足停止条件,即判断i>Iter;
3-3-1)若判断为否,则根据估计行为状态流程更新隐状态场s(i),输入数据为历史流量数据o、当前模型参数输出数据为更新隐状态场s(i),其中,估计行为状态流程中的初始隐状态场使用当前的隐状态场s(i-1);
返回步骤(3-2);
3-3-2)若判断为是,则输出最终模型参数Ω={A,α,B};
根据以上步骤,能够基于历史流量数据训练得到的模型参数Ω={A,α,B},作为流量行为模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810728186.0/1.html,转载请声明来源钻瓜专利网。