[发明专利]流量分类模型建立及流量分类方法、装置、设备和服务器有效
申请号: | 201910203391.X | 申请日: | 2019-03-18 |
公开(公告)号: | CN109995611B | 公开(公告)日: | 2021-06-25 |
发明(设计)人: | 孙尚勇 | 申请(专利权)人: | 新华三信息安全技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L12/24;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 李欣;丁芸 |
地址: | 230001 安徽省合肥市高新区*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 流量 分类 模型 建立 方法 装置 设备 服务器 | ||
1.一种流量分类模型建立方法,其特征在于,所述方法包括:
获取样本流量集,所述样本流量集中包括多个样本流量;
提取所述多个样本流量中各样本流量的行为特征向量,并计算每两个样本流量的行为特征向量之间的距离;
根据所述每两个样本流量的行为特征向量之间的距离及局部密度参数,将所述样本流量集中与第一样本流量的行为特征向量之间的距离小于截断距离的其他样本流量归为与所述第一样本流量同簇,所述局部密度参数包括所述截断距离,所述第一样本流量为所述样本流量集中的任一样本流量;
基于针对所述各样本流量划分的簇,建立流量分类模型;
所述局部密度参数还包括局部密度阈值;
所述根据所述每两个样本流量的行为特征向量之间的距离及局部密度参数,将所述样本流量集中与第一样本流量的行为特征向量之间的距离小于截断距离的其他样本流量归为与所述第一样本流量同簇,包括:
根据所述每两个样本流量的行为特征向量之间的距离及所述截断距离,计算所述各样本流量的局部密度,所述局部密度为所述样本流量集中与所述第一样本流量的行为特征向量之间的距离小于所述截断距离的其他样本流量的总数目;
根据所述各样本流量的局部密度,确定局部密度大于所述局部密度阈值的样本流量为聚类中心,并根据所述局部密度阈值,确定聚类半径,所述局部密度阈值为一个样本流量作为聚类中心时,其周围分布同类型的样本流量的最小数目;
基于所述聚类中心及所述聚类半径,创建簇。
2.根据权利要求1所述的方法,其特征在于,在所述根据所述每两个样本流量的行为特征向量之间的距离及所述截断距离,计算所述各样本流量的局部密度之后,所述方法还包括:
根据所述各样本流量的局部密度及所述每两个样本流量的行为特征向量之间的距离,计算所述各样本流量的核心距离,所述核心距离为所述样本流量集中局部密度大于所述第一样本流量的其他样本流量与所述第一样本流量的行为特征向量之间的距离的最小值;
所述根据所述各样本流量的局部密度,确定局部密度大于所述局部密度阈值的样本流量为聚类中心,包括:
根据所述各样本流量的局部密度及所述各样本流量的核心距离,确定局部密度大于所述局部密度阈值、且核心距离大于所述截断距离的样本流量为聚类中心。
3.根据权利要求1所述的方法,其特征在于,在所述基于针对所述各样本流量划分的簇,建立流量分类模型之后,所述方法还包括:
接收携带有标记类型的流量;
提取所述流量的行为特征向量;
将所述流量的行为特征向量输入所述流量分类模型,确定所述流量的类型;
判断所述类型与所述标记类型是否相同;
若不相同,则调整所述局部密度参数,并根据调整后的所述局部密度参数,重新执行所述根据所述每两个样本流量的行为特征向量之间的距离及局部密度参数,将所述样本流量集中与第一样本流量的行为特征向量之间的距离小于截断距离的其他样本流量归为与所述第一样本流量同簇;
基于重新划分的簇,更新所述流量分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新华三信息安全技术有限公司,未经新华三信息安全技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910203391.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种模拟生物神经形态的对等网络底层通信系统
- 下一篇:流量计算方法和装置