[发明专利]一种深度学习的网络流量分类方法在审

专利信息
申请号: 201610388592.8 申请日: 2016-06-02
公开(公告)号: CN107465643A 公开(公告)日: 2017-12-12
发明(设计)人: 徐杰;陈训逊;王博;崔佳;王东安;包秀国 申请(专利权)人: 国家计算机网络与信息安全管理中心
主分类号: H04L29/06 分类号: H04L29/06;G06F17/30;G06K9/62
代理公司: 北京华仲龙腾专利代理事务所(普通合伙)11548 代理人: 黄玉珏
地址: 100029*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 深度 学习 网络流量 分类 方法
【说明书】:

技术领域

发明属于网络信息安全技术领域,特别涉及一种基于深度学习的网络流量分类方法。

背景技术

随着信息技术的蓬勃发展,种类繁多的互联网应用产生的大量流量占用了很多网络资源,在给服务质量带来巨大挑战的同时也给互联网安全产生负面影响。为了高效地利用网络资源并为网络管理者提供有效的管控手段,以辨别应用层协议为目的的网络流量分类技术成为近年来的研究热点问题。在网络流量分类的传统方法中,应用最广的是基于知名端口号(known ports)的流量分类算法、基于特征字匹配的流量分类算法、基于传输层行为模式的流量分类算法。但是随着端口伪造、明文加密等技术的使用以及网络类别环境差别的增大,上述三种分类方法在现阶段已经无法满足对分类的精度要求。机器学习方法不需要对端口进行匹配,也不需要解析流量的有效载荷内容,同时不受网络环境等影响就可以对网络流量进行高精度的分类,故基于机器学习算法的网络流量分类技术成为近年来的研究热点问题。

发明内容

本发明所要解决的技术问题是克服现有技术的缺陷,提供一种基于深度学习的网络流量分类方法。

本发明的技术方案是,一种基于深度学习的网络流量分类方法,包括如下步骤:

(1)网络流量样本数据的获取;

采用Libpcap库对网络流量进行捕获;

(2)网络流量属性的确定,包括

a.网络流量中客户端端口号统计分析;

b.网络流量中数据包平均到达时间统计分析;

c.网络流量中包含数据包个数统计分析;

(3)网络流量样本标记;

采用一种基于端口号及特征字匹配的网络流量样本标记算法,该算法先利用IANA的知名端口库判断训练样本中流量的端口号是否为知名端口,再利用特征字匹配技术将非知名端口的流量样本进行深度解析匹配,对未知流样本进行标记;

(4)连续数据的离散化;

利用基于粗糙集的方法对网络流量样本中连续的数据进行离散化;

(5)样本的训练;

采用深度学习中的受限玻尔兹曼机,在原始输入特征中抽取低维高度可区分的低维特征作为训练模型的输入,对样本进行训练,使用支持向量机作为回归模型。

本发明的有益效果在于:对纷繁复杂的网络流量资源,能够满足高精度的分类要求。

附图说明

图1为本发明的方法流程图

具体实施方式

下面,结合附图对于本发明进行如下详细说明:

流程图如图1所示,描述了利用深度学习算法对网络流进行分类的过程。首先从外部网络中获取数据,之后将数据进行处理得到用流的属性向量表示的流数据集合,再对流的属性特征进行选择得到待训练数据,利用深度学习算法进行训练得到分类模型,最后利用分类模型对未知样本进行分类。

本发明主要包括以下步骤:

一是网络流量样本数据的获取。常使用普通的PC机,利用Libpcap库对网络流量进行捕获。

二是流量属性的确定。样本数据对学习模型的稳定性、精确性有着至关重要的作用,而样本是由网络流的各项属性计算而来,所以流属性的确定也就决定了流分类的结果精度。本发明采用三种方法进行流量属性确定:1.网络流中客户端端口号统计分析;2.网络流中数据包平均到达时间统计分析;3.网络流中包含数据包个数统计分析。

三是网络流样本的标记。本发明的深度学习算法均是有监督的学习算法,所以机器学习的训练样本中需要包含样本的类别信息,即训练时算法需要事先知道该样本的类别,在对未知样本进行分类时可以增大分类模型的精度。本发明设计了一种基于端口号及特征字匹配的网络流样本标记算法,该算法先利用IANA的知名端口库判断训练样本中流的端口号是否为知名端口,再利用特征字匹配技术将非知名端口的流样本进行深度解析匹配,对未知流样本进行标记。

四是连续数据的离散化。利用基于粗糙集的方法对网络流样本中连续的数据进行离散化。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610388592.8/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top