[发明专利]基于自注意机制的网络流量分类方法、介质及终端设备有效
申请号: | 201911412366.9 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111355671B | 公开(公告)日: | 2023-07-28 |
发明(设计)人: | 江勇;谢国锐;李清;夏树涛;齐竹云 | 申请(专利权)人: | 鹏城实验室;清华大学深圳国际研究生院 |
主分类号: | H04L47/2441 | 分类号: | H04L47/2441;H04L47/2475;H04L47/2483;G06F18/214;G06N3/084;G06F18/2415;G06N3/045;G06N3/0464 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 王永文 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 注意 机制 网络流量 分类 方法 介质 终端设备 | ||
本发明公开了一种基于自注意机制的网络流量分类方法、介质及终端设备,所述方法获取待分类网络流量包数据,并确定所述待分类网络流量包数据对应的输入序列;将所述输入序列输入至预先训练的网络流量分类模型,通过所述网络流量分类模型预测所述待分类网络流量包数据对应的流量类别。本发明使用的网络流量分类模型包括编码模块,所述编码模块包括自注意机制单元,这样通过自注意机制提取有效流量特征,提高了流量分类精度。
技术领域
本发明涉及计算机网络技术领域,特别涉及一种基于自注意机制的网络流量分类方法、介质及终端设备。
背景技术
网络流量分类用于识别不同的协议和应用程序,它对包括服务质量 (QoS)和异常检测等在内的网络管理任务至关重要。过去几十年来,应用协议的类型和多样性大幅增加,这给网络管理带来了巨大挑战。迄今为止,人们已经提出了各种类型的方法来提高流量分类结果的准确度。
目前,普遍使用的流量分类方法大致可以分为三类:基于有效负载检查的方法,基于传统机器学习(ML)的方法和基于深度学习(DL)的方法。
有效负载检查(也称为深度包检测,DPI)需要查看数据包的有效载荷 (用户数据)并与已知的应用签名进行对比。例如,流量中出现“\GET”签名则可被分类为是HTTP流量。著名的DPI库有libprotoident,OpenDPI 和nDPI。虽然DPI在许多实验中都很成功,但是查看有效负载涉及用户隐私并会引发一些法律问题,而且生成应用签名要花费领域专家的大量时间和精力。
基于传统ML的方法使用流量的统计特征(例如,每流持续时间或平均分组大小)来进行分类。在过去的十年中,人们已经提出了各种ML的方法来对网络流量进行分类。比如K最近邻、C4.5决策树和支持向量机等。然而,这些ML方法中的大多数都依赖于手工制作的特征,这些特征非常耗时且容易出错,已经无法应对当前快速增长的网络流量类型。
基于DL的方法不依赖于专家来提取特征或者签名,其具有更强的学习能力,可以获得更高的性能。因此,DL在流量分类领域中受到了很多关注。例如Deep Packet、BSNN等方法都使用了神经网络模型来进行流量分类。然而,基于DL的方法普遍使用有效载荷作为输入,会泄露用户隐私而与用户隐私保护相冲突。
发明内容
本发明要解决的技术问题在于,针对现有技术的不足,提供一种基于自注意机制的网络流量分类方法、介质及终端设备。
为了解决上述技术问题,本发明所采用的技术方案如下:
一种基于自注意机制的网络流量分类方法,所述方法包括:
获取待分类网络流量包数据,并确定所述待分类网络流量包数据对应的输入序列;
将所述输入序列输入至预先训练的网络流量分类模型,通过所述网络流量分类模型预测所述待分类网络流量包数据对应的流量类别,其中,所述网络流量分类模型包括编码模块,所述编码模块包括自注意机制单元。
所述自注意机制的网络流量分类方法,其中,所述获取待分类网络流量包数据,并确定所述待分类网络流量包数据对应的输入序列具体包括:
获取待分类网络流量包数据;
读取所述获取待分类网络流量包数据的数据包头部,并在所述数据包头部中选取预设数量的字节以形成输入序列,其中,所述输入序列未携带所述数据包头部中的地址信息。
所述自注意机制的网络流量分类方法,其中,所述网络流量分类模型包括嵌入模块以及分类模块,所述通过所述网络流量分类模型预测所述待分类网络流量包数据对应的流量类别具体包括:
将所述输入序列输入至所述嵌入模块,通过所述嵌入模块输出所述输入序列对应的输入矩阵;
将所述输入矩阵输入至编码模块,以通过编码模块输出所述输入序列对应的特征矩阵;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鹏城实验室;清华大学深圳国际研究生院,未经鹏城实验室;清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911412366.9/2.html,转载请声明来源钻瓜专利网。