[发明专利]一种基于二进制编码器和多哈希表的网络流量分类方法有效
申请号: | 201811380024.9 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109376797B | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 齐恒;周文蘂;李克秋;王军晓 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/2413;H04L47/2441 |
代理公司: | 大连星河彩舟专利代理事务所(普通合伙) 21263 | 代理人: | 马新月 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于二进制编码器和多哈希表的网络流量分类方法属于计算机网络和机器学习的交叉领域。本发明首先通过网络流量数据采集模块获取网络流量数据,然后提取网络流统计特征并进行预处理,得到特征数据之后,需要对网络流量构建无监督二进制编码器并得到其二进制编码,接着在哈希索引模块针对网络流量数据创建多个子串的哈希表,即创建哈希索引,最后采用机器学习方法即基于多哈希表的KNN分类模块对得到的哈希编码进行分类。本发明无需反复对分类器进行学习训练,能够提高分类算法的运行速率及可扩展性;利用二进制编码降低流量数据所占用的存储空间和流量分类所消耗的计算资源。本方法更适用于解决当前新应用层出不穷的互联网环境下的流量分类问题。 | ||
搜索关键词: | 一种 基于 二进制 编码器 多哈 网络流量 分类 方法 | ||
【主权项】:
1.一种基于二进制编码器和多哈希表的网络流量分类方法,其特征在于,所述的网络流量分类方法不需要通过对有标签的训练集不断进行训练来寻找网络流量特征数据的模式,基于以下五个模块实现:网络流量数据采集模块、网络流量特征预处理模块、二进制编码器模块、哈希索引模块、基于多哈希表的KNN流量分类器模块;首先,通过网络流量数据采集模块获取网络流量数据;其次,通过网络流量特征预处理模块提取网络流统计特征并进行预处理,得到特征数据之后,需要对于网络流量构建无监督二进制编码器并得到其二进制(哈希)编码;再次,通过哈希索引模块对需要分类的网络流量数据创建多个子串的哈希表,创建相应的哈希索引;最后,通过基于多哈希表的分类/查找模块,采用机器学习方法基于多哈希表的KNN分类模块对得到的哈希编码进行分类,最终获得对网络流量的分类结果并对该分类方法性能进行评估;所述的二进制编码器模块,该模块采用无监督RBA哈希编码算法,并对得到的哈希编码进行评估,只有在评估的结果达到高精度时将其应用于二进制编码器模块,对网络流量进行哈希编码;所述的基于多哈希表的KNN流量分类器模块,在该模块中,采用多索引哈希实现基于多哈希表的KNN流量分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811380024.9/,转载请声明来源钻瓜专利网。