[发明专利]一种基于半监督学习的网络流量分类方法、计算机设备在审
申请号: | 201711103392.4 | 申请日: | 2017-11-10 |
公开(公告)号: | CN107819698A | 公开(公告)日: | 2018-03-20 |
发明(设计)人: | 冉静;孔晓晨;刘元安;胡鹤飞;袁东明 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04L12/851 | 分类号: | H04L12/851;H04L12/26;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于半监督学习的网络流量分类方法及系统,该方法包括获取已标记和未标记类型的网络流,提取每条网络流中的流特征,得到网络流特征向量;利用已标记数据计算出每个流特征的信息增益,并进行特征加权;将已标记和未标记类型的网络流进行混合聚类;获取每个聚簇中已标记网络流的数目,并确定每个聚簇中每个类型的占比值;当聚簇中已标记网络流总数目相加小于预设网络流阈值时,则判定为未知协议簇,否则判定为已标记网络流中比例最大的类型;直到都判定出流量类型的流量簇,并利用其训练出一个线上的实时分类器。还涉及一种计算机设备,该设备包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序。 | ||
搜索关键词: | 一种 基于 监督 学习 网络流量 分类 方法 计算机 设备 | ||
【主权项】:
一种基于半监督学习的网络流量分类方法,其特征在于,该网络流量分类方法包括:S1,获取已标记类型和未标记类型的网络流,按照预设固定量来提取每条网络流中的流特征,得到网络流特征向量;S2,根据已标记类型的网络流,计算出所述预设固定量中每个流特征的信息增益,并根据所述信息增益对每个流特征进行特征加权;S3,将已标记类型和未标记类型的网络流进行混合,并利用k‑means算法对混合后的网络流进行聚类,得到k个聚簇;S4,获取所述k个聚簇中的每个聚簇中已标记网络流特征向量的数目,并确定每个聚簇中每个类型的占比值;其中所述占比值是等于每个类型的已标记网络流特征向量的数目占簇中总的已标记网络流特征向量的数目的比例;S5,当每个聚簇中已标记网络流特征向量的总数目相加小于预设网络流阈值时,则将相应的聚簇判定为未知协议簇,否则将相应的聚簇判定为已标记网络流特征向量中比例最大的类型;S6,重复步骤S4‑S5,直到k个聚簇都判定出流量类型的流量簇;S7,将所述判定出流量类型的流量簇作为训练数据,训练出线上的流量分类器。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711103392.4/,转载请声明来源钻瓜专利网。
- 上一篇:数据传输方法、交换机及数据中心
- 下一篇:一种数据业务的处理方法及系统