[发明专利]一种基于密度数据描述的SSL VPN流量识别方法有效
申请号: | 201910498412.5 | 申请日: | 2019-06-10 |
公开(公告)号: | CN110311870B | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 刘扬;吕思才;黄俊恒;孙云霄;王佰玲;王超 | 申请(专利权)人: | 哈尔滨工业大学(威海);哈工大(威海)创新创业园有限责任公司 |
主分类号: | H04L47/2483 | 分类号: | H04L47/2483;H04L47/2441;H04L12/46 |
代理公司: | 青岛华慧泽专利代理事务所(普通合伙) 37247 | 代理人: | 马千会 |
地址: | 264209 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密度 数据 描述 ssl vpn 流量 识别 方法 | ||
本发明属于网络数据处理技术领域,涉及SSL VPN流量识别方法。一种基于密度数据描述的SSL VPN流量识别方法,包括:从网络流量中抓取使用SSL协议来保证安全传输的流量;将抓取到的SSL流量进行特征提取;以基于密度描述的SSL VPN的数据描述域作为判别依据,对提取到的特征向量进行分类判别,如果落在数据描述域内,则认为是SSL VPN流量,否则认为是普通的SSL流量。本发明的基于密度数据描述的SSL VPN流量识别方法,可以将SSL VPN流量转换成特征向量,由提出了一种的基于密度的数据描述,可以基于密度找到数据描述域,用于对SSL VPN流量进行分类。
技术领域
本发明属于网络数据处理技术领域,涉及SSL VPN流量识别方法。
背景技术
随着大数据时代的到来,数据的采集也变得越来越方便,当数据采集完成之后,如何从数据中获取需要的信息成了新的挑战。分类问题作为机器学习的一个重要类别,基于已有的数据构建模型,进而对获取到未知类别数据的所属类别进行判断。但是分类需要的带标签的训练数据的获取并不容易,如VPN流量,往往可以通过多种方法获取带标签的VPN流量,而非VPN流量种类繁多,通常获取的反例集很难囊括所有的非VPN的流量种类。这种情况下可以用于训练的有标签的数据只有一类。
目前,针对这种仅可获得单类数据的情况,学者们也提出了相应的分类模型,其中使用最为广泛的就是One-Class SVM和SVDD。One-Class SVM的核心思想将坐标原点作为奇异点,找到超平面使得单类数据集与坐标原点分别落于超平面的两侧,同时使得坐标原点于超平面的距离尽可能的大,预测时将与训练样本落于同一侧的数据认为是目标类的数据,否则认为不是目标类的数据。SVDD则是通过核函数将原始样本映射到高维空间,在高维空间中寻找一个包含大部分数据的超球体,同时使得超球体的体积尽可能的小,进行预测时,认为落于超球内的数据为目标类的数据,否则不是。这两种算法被证明在处理单分类问题上效果相似。
还有一些学者将单分类问题作为异常检测问题来处理,将非目标类的数据作为异常点。应用比较广泛的有孤立森林(Isolation Forest),构造孤立树时,会随机选取一个特征,在该特征的取值范围中随机选择一个值划分数据集,迭代多轮,直到叶节点中只有一个数据点,就得到一个孤立树(Isolation Tree),同时构建多棵孤立树得到孤立森林。由于异常值是离群点,所以会比较快的划分到叶子节点;而非离群点往往需要经过更多次划分才能落到叶节点。可以通过叶节点和根节点的路径长度来判断是否为异常点。
VPN是在公共网络上建立专用网络,进行通信加密。所以,VPN流量必然涵盖多种类型流量,获得的VPN数据集内部通常含有多个类簇,所以,如何将 VPN流量数据进行分类、识别,获取需要的信息显得非常必要。
发明内容
为了解决VPN流量识别问题,本发明提出了基于密度数据描述的SSL VPN 流量识别方法。该方法从VPN流量数据的内部分布出发,划分数据描述域,从而实现VPN流量识别。
本发明解决其技术问题采用的技术方案是:一种基于密度数据描述的SSL VPN流量识别方法,包括:
从网络流量中抓取使用SSL协议来保证安全传输的流量;
将抓取到的SSL流量进行特征提取;
以基于密度描述的SSL VPN的数据描述域作为判别依据,对提取到的特征向量进行分类判别,如果落在数据描述域内,则认为是SSL VPN流量,否则认为是普通的SSL流量。
进一步的,所述基于密度描述的SSL VPN的数据描述域的获取方法为:
构建SSL VPN流量数据密度描述模型函数;
对所述的模型函数进行初步训练,得到一个密度最大的超球;
对所述的模型函数进行进一步训练,将散落在密度最大的超球面外的数据点重新划分数据描述域,得到多个超球面;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海);哈工大(威海)创新创业园有限责任公司,未经哈尔滨工业大学(威海);哈工大(威海)创新创业园有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910498412.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置