[发明专利]一种基于双阶段判定的加密流量分类方法有效
申请号: | 201910673679.3 | 申请日: | 2019-07-24 |
公开(公告)号: | CN110414594B | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 马小博;师马玮;安冰玉;刘文懋;樊志甲;赵粤征 | 申请(专利权)人: | 西安交通大学;北京神州绿盟信息安全科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 范巍 |
地址: | 710049 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 阶段 判定 加密 流量 分类 方法 | ||
1.一种基于双阶段判定的加密流量分类方法,其特征在于,包括以下步骤:
步骤1:生成加密流量样本第一阶段训练集;用户提供加密流量样本集合,集合中的每一个加密流量样本是包含数据包的原始流量文件,且有唯一的加密流量类型标签;将用户提供的d维特征向量,记为元特征向量;根据该特征向量,对每一个加密流量样本进行向量化表示;采用元特征向量对加密流量样本集合向量化表示后,保留每个加密流量样本的加密流量类型标签,得到加密流量样本第一阶段训练集;
步骤2:生成加密流量类型第一阶段判定模型C;以步骤1得到的加密流量样本第一阶段训练集作为输入,训练随机森林分类算法,得到第一阶段判定模型;该判定模型由m棵决策树构成,每一棵决策树均有独立判定结果;该判定模型综合所有决策树的独立判定结果,输出综合判定结果;
步骤3:生成加密流量样本第二阶段训练集;对步骤1的加密流量样本第一阶段训练集中的每一个样本,将步骤2中所有决策树的独立判定结果,作为该样本的k维特征向量,记为复合特征向量;采用复合特征向量对加密流量样本集合向量化表示后,保留每个加密流量样本的加密流量类型标签,得到加密流量样本第二阶段训练集;
步骤4:生成加密流量类型第二阶段判定模型C';以步骤3得到的加密流量样本第二阶段训练集作为输入,训练K-最近邻(KNN)分类算法,得到第二阶段判定模型;
步骤5:双阶段判定加密流量样本的加密流量类型;给定任意一个加密流量样本,首先,采用步骤2所得到的加密流量类型第一阶段判定模型生成判定结果;接着,采用步骤4所得到的加密流量类型第二阶段判定模型生成判定结果;比较两次判定结果,若两次判定结果一致,则输出判定结果,且结果与两次判定结果一致;若两次判定结果不同,则不输出判定结果。
2.根据权利要求1所述的一种基于双阶段判定的加密流量分类方法,其特征在于,步骤1中,元特征向量包含d维特征,记为[f1,f2,…,fd];设总共有p个加密流量样本,第i个加密流量样本的加密流量类型被标定为labeli,则加密流量样本第一阶段训练集记为T,表示如下:
T={label1:[f1,f2,…,fd],label2:[f1,f2,…,fd],…,labelp:[f1,f2,…,fd]}。
3.根据权利要求1所述的一种基于双阶段判定的加密流量分类方法,其特征在于,步骤3中,复合特征向量包含k维特征,记为[F1,F2,…,Fk];设总共有p个加密流量样本,第i个加密流量样本的加密流量类型被标定为labeli,则加密流量样本第一阶段训练集记为T',表示如下:
T'={label1:[F1,F2,…,Fk],label2:[F1,F2,…,Fk],…,labelp:[F1,F2,…,Fk]}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学;北京神州绿盟信息安全科技股份有限公司,未经西安交通大学;北京神州绿盟信息安全科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910673679.3/1.html,转载请声明来源钻瓜专利网。