[发明专利]一种基于混合高斯的SDN流聚类方法有效

专利信息
申请号: 201510488828.0 申请日: 2015-08-11
公开(公告)号: CN105005629B 公开(公告)日: 2017-07-04
发明(设计)人: 郑相涵;陈锋情 申请(专利权)人: 福州大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 福州元创专利商标代理有限公司35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 混合 sdn 流聚类 方法
【权利要求书】:

1.一种基于混合高斯的SDN流聚类方法,其特征在于包括以下步骤;

步骤S1:对原始SDN数据进行五元组记录,并且采用KMeans聚类算法,完成SND数据流与用户之间的映射关系;

步骤S2:利用高斯混合模型GMM以及公式对SDN数据流的概率密度分布进行估计,其中K为高斯模型的个数,ai为第i个高斯模型的权重,pi(x|θi)为第i个高斯模型的概率密度函数,所述pi(x|θi)的均值为μk,方差为σk;θi=(μi,∑i),μi,∑i为待求解的数据生成模型的参数;

步骤S3:采用流持续时间、数据包数量、流大小、数据包大小、数据包间隔时间作为SDN流向量属性,通过边信息获得SDN流等价集;

步骤S4:对高斯混合模型GMM的数据生成模型进行调整;

步骤S5:采用must-link成对点约束和cannot-link成对点约束来辅助聚类;

其中,所述的五元组包括源IP、源端口、目标IP、目标端口以及协议;

其中,所述步骤S4具体包括以下步骤:

步骤S41:将SDN流边信息的取值空间表示为其中,Y={y1,…,yi,…,yN},yi表示第i个数据点的聚类中心,表示在第s个等价集中第i个数据点的聚类中心,Ys表示第s个等价集Xs的概率分布,Xs包含Ns条数据流,所有等价集包含的数据条数x={x1,…xN}表示N条数据流,X={X1,…XM}表示M个等价集,Xs是X1至XM中的其中一个等价集,yi∈{1,…,K},K为聚类中心的个数;

步骤S42:建立基于约束最大化的log-likelyhood function:根据数据生成模型得到边缘概率分布为:

<mrow><mi>P</mi><mrow><mo>(</mo><mi>y</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>y</mi><mo>&Element;</mo><mi>&Omega;</mi><mo>,</mo><msup><mi>&theta;</mi><mi>g</mi></msup><mo>)</mo></mrow><mo>=</mo><mfrac><mrow><mi>P</mi><mrow><mo>(</mo><mi>y</mi><mo>&Element;</mo><mi>&Omega;</mi><mo>|</mo><mi>X</mi><mo>,</mo><mi>y</mi><mo>,</mo><msup><mi>&theta;</mi><mi>g</mi></msup><mo>)</mo></mrow><mi>P</mi><mrow><mo>(</mo><mi>y</mi><mo>|</mo><mi>X</mi><mo>,</mo><msup><mi>&theta;</mi><mi>g</mi></msup><mo>)</mo></mrow></mrow><mrow><mi>P</mi><mrow><mo>(</mo><mi>y</mi><mo>&Element;</mo><mi>&Omega;</mi><mo>|</mo><mi>X</mi><mo>,</mo><msup><mi>&theta;</mi><mi>g</mi></msup><mo>)</mo></mrow></mrow></mfrac><mo>=</mo><mfrac><mrow><munderover><mo>&Pi;</mo><mrow><mi>s</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msub><mi>&delta;</mi><msub><mi>Y</mi><mi>S</mi></msub></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>Y</mi><mi>S</mi></msub><mo>|</mo><msub><mi>X</mi><mi>S</mi></msub><mo>,</mo><msup><mi>&theta;</mi><mi>g</mi></msup><mo>)</mo></mrow></mrow><mrow><munder><mo>&Sigma;</mo><msub><mi>Y</mi><mn>1</mn></msub></munder><mn>...</mn><munder><mo>&Sigma;</mo><msub><mi>Y</mi><mi>M</mi></msub></munder><munderover><mo>&Pi;</mo><mrow><mi>j</mi><mo>=</mo><mn>1</mn></mrow><mi>M</mi></munderover><msub><mi>&delta;</mi><msub><mi>Y</mi><mi>j</mi></msub></msub><mi>P</mi><mrow><mo>(</mo><msub><mi>Y</mi><mi>j</mi></msub><mo>|</mo><msub><mi>X</mi><mi>j</mi></msub><mo>,</mo><msup><mi>&theta;</mi><mi>g</mi></msup><mo>)</mo></mrow></mrow></mfrac><mo>,</mo></mrow>

其中θg是当前参数估计,θ是迭代计算后的参数估计,X表示等价集,Y为等价集在各个聚类中心点的分布概率,y=yi,aYS表示每一个聚类中心的先验概率;其中,E表示求数学期望;

步骤S43:将log-likelyhood function简化为其中,每一个等价集的后验概率计算定义如下:其中为当前l类的权重,表示当前参数估计下x的概率,为等价集Xs的元素,表示旧的参数估计,θl表示新的参数估计,l表示第l的聚类中心;

步骤S44:使用带约束的最大似然估计的方法求解数据生成模型的参数,使得QC(θ,θg)的取值最大化;其中其中表示等价集Xs的元素;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510488828.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top