[发明专利]一种面向分布式网络的流量行为分析方法有效

专利信息
申请号: 201810728186.0 申请日: 2018-07-05
公开(公告)号: CN108923975B 公开(公告)日: 2021-08-10
发明(设计)人: 马海寿;谢逸;王臻 申请(专利权)人: 中山大学
主分类号: H04L12/24 分类号: H04L12/24;H04L12/26
代理公司: 广州圣理华知识产权代理有限公司 44302 代理人: 顿海舟
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 分布式 网络 流量 行为 分析 方法
【权利要求书】:

1.一种面向分布式网络的流量行为分析方法,其特征在于,具体为:

模型训练阶段:采集网络历史流量数据作为训练模型的训练数据,得到网络流量行为模型;

学习阶段:将采集的实时流量数据输入训练好的网络流量行为模型,并利用最大后验估计准则经过迭代计算得到网络全局流量行为;

所述模型训练阶段的实现过程具体为:确定网络流量行为模型结构及估计模型参数;

确定网络流量行为模型结构:

将分布式网络流量行为信息分为两层:隐状态层和观测数据层,观测数据层是由网络探针测量得到的网络节点流量数据构成,隐状态层是由网络节点的行为模式构成,表示网络内在驱动因素,直接驱动网络节点流量外在表现;使用随机变量来表示隐状态和观测值,因此隐状态层和观测数据层构成了两个随机场,即隐状态场和观测场;

定义数学符号:在一个拥有N个节点的网络中,¥表示网络节点集合,xt,n∈E表示在第t个时隙的第n个节点,n∈¥,其中表示所有空时位置节点集合,有|E|=|¥|×T,T是时隙数量;使用St,n表示节点xt,n的隐状态变量,st,n∈S表示随机变量St,n的一个实例,其中S代表隐状态集合,则表示定义在E上的隐状态随机变量族;因此,能够使用S表示在[1,T]上的隐状态场,s∈S表示S的一个配置,其中S表示隐状态场所有可能配置集合;使用相似的表示式,Ot,n表示节点xt,n的观测值变量,ot,n∈O表示随机变量Ot,n的一个实例,其中O表示观测值集合,则表示定义在E上的观测值随机变量族;因此,能够使用O表示在[1,T]上的观测场,o∈O表示O的一个配置,其中O表示观测场所有可能配置集合;

使用HMRF模型刻画隐状态场与观测场之间的空时演变关系;

针对隐状态场,引入一个假设:空间上一个节点仅和它的一跳邻居节点的状态有关,时间上仅和它前一个时刻的状态有关;基于统计学习的方法,隐状态场的概率能够通过以下公式获取:

其中,E-{xt,n}表示不包含节点xt,n的网络空时位置节点集合,与分别表示节点xt,n的空间邻居状态与时间邻居状态,λ表示隐状态场参数;

公式(1)中的局部概率,通过以下公式获取:

其中,m表示节点状态,时间转移概率根据时间隐状态转移概率矩阵A计算,A表示隐状态从t时刻到t+1时刻的状态转移概率矩阵,即时间隐状态转移构成一阶马尔科夫链;A矩阵由下式表示:

其中Pij的下标i和j分别表示节点在t和t+1时刻所处的隐状态;空间转移概率通过以下公式获取:

其中,Ut,n(m)表示边缘能量函数,且表示节点xt,n的空间邻居节点,表示节点xt,n的空间邻居节点数量,其中势函数定义为:Vt,n(m)=num·α,其中参数α用于刻画当前节点与其空间邻居节点相互影响关系的强弱,num表示空间邻居节点状态与当前节点状态不相同的数量;

针对观测场,网络节点观测值通过网络探针获得,即网络的观测场是已知数据;设一个节点的观测值只与该节点的状态有关,观测场在隐状态驱动下的输出概率通过以下公式获取:

其中,连乘符号下标(t,n)表示Pr[Ot,n=k|St,n=m,θm]表示t时刻,节点n在状态为m的条件下输出观测值为k的概率,为了方便计算,将观测值Ot,n进行离散化,使用频率来近似代替概率,即使用观测值在状态m的频率分布来近似条件概率,参数θm表示在特定的状态下观测值的分布参数,这里使用输出概率矩阵B表示,称为观测场参数,B矩阵由下式表示:

其中Pmk表示节点在状态m输出观测值为k的概率;

由此,确定网络流量行为模型结构,网络流量行为模型由HMRF模型刻画,因此模型参数为Ω={A,α,B},

估计模型参数;

当采集到历史流量数据以及确定流量行为模型结构之后,利用历史流量数据训练模型参数Ω={A,α,B};为了便于实际工程应用,在计算过程中使用频率近似概率,因此计算之前需要对观测值Ot,n进行离散化;

其训练过程输入历史流量数据o,即网络节点观测值,输出模型参数Ω={A,α,B};估计模型参数流程步骤如下:

(3-1)初始化迭代轮询初始值i、迭代停止条件Iter、初始隐状态场s(1)

其中迭代轮询初始值i初始化为1;迭代停止条件设置为迭代停止次数Iter,根据经验优选设置为5-8次;另外,迭代停止条件也能够设置为前后两次迭代过程参数变化范围阈值,当变化范围小于给定阈值时,停止迭代;初始隐状态场s(1)根据历史流量数据观测值使用聚类算法进行初始化,聚类类别数量根据实际网络监控需求确定,类别数量对应网络节点行为状态数量,因此类别数量反映了对网络流量行为刻画的粒度,行为状态数量越多,能够刻画的流量行为粒度越细;

(3-2)根据隐状态场的配置情况更新模型参数,依据时间状态跳转的频率更新时间隐状态转移概率矩阵A,设时刻t处于状态i时刻t+1转移到状态j的频数记为Aij,那么A中状态转移概率Pij的估计值由以下公式获取:

依据经验公式确定α值,经验值优选0.5-10之间,α越大,表示节点之间相互作用越大,邻居节点的状态对当前节点的状态影响越大,反之亦然;依据相应状态输出观测值的频率分布更新输出概率矩阵B,设样本中状态为m并且观测值为k的频数是Bmk,那么B中输出概率Pmk的估计值由以下公式获取:

同时,迭代轮询次数加1,即i=i+1;

(3-3)判断是否满足停止条件,即判断i>Iter;

3-3-1)若判断为否,则根据估计行为状态流程更新隐状态场s(i),输入数据为历史流量数据o、当前模型参数输出数据为更新隐状态场s(i),其中,估计行为状态流程中的初始隐状态场使用当前的隐状态场s(i-1)

返回步骤(3-2);

3-3-2)若判断为是,则输出最终模型参数Ω={A,α,B};

根据以上步骤,能够基于历史流量数据训练得到的模型参数Ω={A,α,B},作为流量行为模型。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810728186.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top