[发明专利]基于负载映射与随机森林的非加密流量识别方法在审
申请号: | 201810449191.8 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108737290A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 邹学强;张玉;包秀国;金宇菲;张建忠 | 申请(专利权)人: | 南开大学;国家计算机网络与信息安全管理中心 |
主分类号: | H04L12/851 | 分类号: | H04L12/851 |
代理公司: | 泰州地益专利事务所 32108 | 代理人: | 谭建成 |
地址: | 300350*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明针对于非加密流量提出了一种移动应用流量识别方法。方法结合向量空间映射与随机森林分类器,包括预处理阶段,用于将流量负载进行预处理;随机森林分类器建模阶段,将流量负载映射到向量空间,利用流量训练集合建立随机森林模型;分类阶段,待识别流量通过随机森林模型分类。常见的非加密流量识别方法,局限于寻找固定长度或可变长度的特征字符串,为此花费了巨大的精力。本发明引入自然语言处理领域的方法。将非加密负载转化为向量,克服了寻找特征字符时间复杂度大的特点。本发明可以用于非加密流量的应用类型识别,具有较高的识别准确度。 | ||
搜索关键词: | 随机森林 映射 随机森林分类器 加密流量识别 加密流量 流量负载 向量空间 预处理 应用类型识别 自然语言处理 时间复杂度 特征字符串 预处理阶段 准确度 分类阶段 加密负载 建模阶段 流量识别 模型分类 特征字符 训练集合 移动应用 可变 向量 局限 引入 转化 | ||
【主权项】:
1.一种非加密移动应用流量识别方法,具体包括:方法基于随机森林分类器,包括预处理阶段、随机森林分类器建模阶段和预测阶段;预处理阶段,负责提取数据包负载中的有用信息,以降低训练和预测时的复杂度,且能降低噪声;随机森林分类器建模阶段,将负载映射为向量空间中的TFIDF向量,以此进行随机森林分类器的训练;预测阶段,对未知标签的流量,提取出数据包负载,经过预处理阶段,提取出有用信息,同样经过负载映射到向量空间,将该向量输入到分类器模型中,得到预测标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学;国家计算机网络与信息安全管理中心,未经南开大学;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810449191.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种存储多路径负载均衡方法及系统
- 下一篇:一种网络流量表示的方法及装置