[发明专利]一种面向应用软件的网络流量细粒度分类系统及方法在审
申请号: | 201910232314.7 | 申请日: | 2019-03-26 |
公开(公告)号: | CN109981474A | 公开(公告)日: | 2019-07-05 |
发明(设计)人: | 于爱民;徐震;赵力欣;蔡利君;孟丹 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | H04L12/801 | 分类号: | H04L12/801;H04L12/851 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 安丽;邓治平 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种面向应用软件的网络流量细粒度分类系统及方法,包括:数据收集与预处理模块、特征提取与模型训练模块、流关联分析模块;数据收集与预处理模块:收集操作系统背景流量,收集目标应用软件的网络流量,然后进行预处理,从中过滤掉背景流量数据包和错误数据包,并按照流量五元组提取出流;特征提取与模型训练模块:针对提取出的每条流,利用一阶马尔科夫模型对流中的包大小序列进行建模,计算包大小序列的转移概率矩阵,并将其作为特征向量训练分类模型;流关联分析模块:对分类器的分类结果进行置信度检验,将小于类别概率阈值的流标记为模糊流,将模糊流与非模糊流通过K近邻端口进行关联分析,修正模糊流的类别标签,得到最终的分类结果。 | ||
搜索关键词: | 网络流量 模糊 关联分析模块 模型训练模块 细粒度分类 预处理模块 背景流量 分类结果 数据收集 特征提取 应用软件 预处理 马尔科夫模型 目标应用软件 转移概率矩阵 错误数据包 关联分析 类别标签 类别概率 特征向量 训练分类 分类器 流标记 数据包 五元组 置信度 建模 一阶 与非 操作系统 过滤 对流 修正 检验 | ||
【主权项】:
1.一种面向应用软件的网络流量细粒度分类系统,其特征在于,包括:数据收集与预处理模块、特征提取与模型训练模块、流关联分析模块;其中:数据收集与预处理模块:收集操作系统自身产生的网络流量,该流量为背景流量;收集目标应用软件的网络流量,然后进行预处理,从中过滤掉背景流量数据包和错误数据包,并按照流量五元组(源IP,目的IP,源端口,目的端口,传输层协议)提取出流(flow),其中,一条流是指具有相同五元组的一组连续的数据包;特征提取与模型训练模块:针对提取出的每条流,获取其包大小序列,按照均匀分布的映射规则将包大小序列映射为状态序列,使用一阶马尔科夫模型对得到的状态序列进行建模,计算该序列的转移概率矩阵,并将转移概率矩阵作为特征向量,使用支持向量机(SVM)算法来训练分类器;流关联分析模块:对分类器的分类结果进行置信度检验,通过将分类器输出的后验概率与类别概率阈值进行比较,将流样本分为模糊流和非模糊流两类,小于类别阈值的流标记为模糊流,其他标记为非模糊流;将模糊流与非模糊流通过K近邻端口进行关联分析,通过非模糊流的类别标签来修正模糊流的类别标签,得到最终的分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910232314.7/,转载请声明来源钻瓜专利网。