首页在售求购查询申请展会资讯专利榜企服商城升级VIP

立即登录免费注册

在售专利
求购专利
查询专利
新闻资讯
技术展会
招商加盟
专利榜

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247 本网专利代理业务由天津创信方达专利代理事务所(普通合伙)承接机构代码：12247

[发明专利]一种基于集成学习的加密流量识别方法有效

申请号：	202010143787.2	申请日：	2020-03-04
公开（公告）号：	CN111385145B	公开（公告）日：	2023-04-25
发明（设计）人：	翟江涛;崔永富;林鹏;吉小鹏;石怀峰;张艳艳;付章杰	申请（专利权）人：	南京信息工程大学
主分类号：	H04L9/40	分类号：	H04L9/40;H04L43/0876;H04L43/026;H04L47/2483;H04L47/2441
代理公司：	南京苏高专利商标事务所(普通合伙) 32204	代理人：	柏尚春
地址：	210044 江苏***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于集成学习加密流量识别方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于集成学习的加密流量识别方法，其特征在于，包括以下步骤：

(1)数据集采集：抓取网络流量，生成会话，通过五元组对流量过滤分流获取原始实验数据集；

(2)数据预处理：读取数据流，截断数据，并进行归一化处理；

(3)平衡数据集：采用SMOTE算法，以一定概率选用样本点周围的点，对不平衡数据集进行处理，其中，选点原则为欧式距离越近，选用概率值越大，欧式距离越远则概率值越小，呈指数下降趋势，具体包含以下步骤：

(31)设训练集的少数类的样本数为T，目标合成少数类到NT个新样本，N为正整数，少数类的一个样本的特征向量为X_i，i∈{1,...,T}；

(32)在少数类的全部T个样本中用欧氏距离找到样本X_i的k个近邻，记为x_i(near)，near∈{1,...,k}；

(33)这x_i(near)中选择概率值最大的一个样本x_i(nn)，再生成一个0到1之间的随机数ζ₁，从而合成一个新样本X_i1，其中X_i1＝X_i+ζ₁*(X_i(nn)-X_i)；

(34)将步骤(33)重复进行N次，从而可以合成N个新样本：X_i(new)，new∈1,...,N；

(35)对全部的T个少数类样本进行步骤(32)～(34)操作，完成为少数类合成NT个新样本；

(4)自动提取特征：利用堆栈式自动编码器模型自动提取特征；

(5)识别流量：将自动提取的特征输入集成学习算法识别目的加密流量；即将特征输入二级分类器Kmeans聚类，并对聚类不纯净的簇其内部使用基于遗传算法改进的随机森林CGA-RF分类器进行分类，通过交叉验证方式调试分类器参数，得到最优的分类器模型并决策评估，其中CGA-RF算法包含以下步骤：

(51)用训练集构建一定数量的决策树，组成原始的决策树集合；

(52)根据选择性集成的思路，从原始的决策树集合中筛选出性能较优的决策树，构成新的决策树集合；

(53)利用遗传算法迭代多次得到最优的随机森林模型。

2.根据权利要求1所述的基于集成学习的加密流量识别方法，其特征在于，所述步骤(1)具体为：其中对于TCP流，从发起连接的三次握手的SYN包开始，到断开连接的FIN包或RST包为结束；对于UDP流，以第一个数据包的到达为开始，如果两个数据包到达的时间间隔超过60s，则认为数据流结束。

3.根据权利要求1所述的基于集成学习的加密流量识别方法，其特征在于，所述步骤(2)具体为：

(21)读取数据流，判断数据流长度是否大于n个字节；

(22)若长度大于等于n个字节，进行去除数据链路层和UDP头部填充0的操作；

(23)若长度小于n个字节进行数据包填充0的操作；

(24)对提取的数据进行归一化处理。

4.根据权利要求1所述的基于集成学习的加密流量识别方法，其特征在于，所述步骤(4)具体包括以下步骤：

(41)给定初始输入X，采用无监督方式训练第一层自动编码器V，输出为Y，设定输入X和输出Y的损失函数，即重构误差，并获得最小化重构误差；

(42)将第一层自动编码器隐含层的输出Y作为第二个自动编码器的输入，采用以上同样的方法训练自动编码器Z；

(43)重复(42)直到初始化完成所有自动编码器；

(44)将最后一个堆栈式自动编码器的隐含层输出作为分类器的输入，然后采用有监督的方法训练分类器的参数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于南京信息工程大学，未经南京信息工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010143787.2/1.html，转载请声明来源钻瓜专利网。

上一篇：一种变压器电磁振动噪音仿真分析方法
下一篇：基于数据模型的半导体器件物理可视化仿真平台设计方法

同类专利

专利分类

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L9-00 保密或安全通信装置
H04L9-06 .使用移位寄存器或存储器用于块式码的密码装置，例如dES系统
H04L9-10 .带有特殊机体，物理特征或人工控制
H04L9-12 .同步的或最初建立特殊方式的发送和接收密码设备
H04L9-14 .使用多个密钥或算法
H04L9-18 .用串行和连续修改数据流单元加密，例如数据流加密系统

免登录下载普通用户下载升级VIP会员，免费下载

友情链接：交换友情链接需要网站权重大于4，网站收录10W以上，如符合条件，请联系QQ：。

关于我们寻求报道投稿须知广告合作版权声明网站地图友情链接企业标识联系我们

在线咨询

周一至周五 9:00-18:00

版权所有http://www.vipzhuanli.com/公布日期

咨询在线客服

咨询在线客服

tel code back_top