[发明专利]一种基于特征强相关的网络流量分类方法在审
申请号: | 201910198841.0 | 申请日: | 2019-03-15 |
公开(公告)号: | CN110009005A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 张登银;吴思远;丁飞;赵莎莎;张恩轩;郭诗源 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于特征强相关的网络流量分类方法,包括以下4个步骤:输入需要训练的数据,对输入数据进行特征提取,形成一个多维特征向量集合;利用特征与响应变量之间的互信息计算特征之间的相关性;根据互信息计算特征之间的冗余度,并通过迭代计算选出得分最高的特征作为最终的特征向量;根据分类目标构建基于特征强相关的网络流量分类模型并得到分类结果。本发明能够充分利用特征之间的相关性,在学习器训练过程中提取出相关性最大冗余度最小的特征,在相同的分类模型下,能够在保证分类精度的前提下有效提升分类效率,解决现有基于启发式搜索的特征选择方法未考虑特征之间相关性导致的不足。 | ||
搜索关键词: | 网络流量分类 强相关 互信息计算 冗余度 多维特征向量 启发式搜索 迭代计算 分类结果 分类模型 分类目标 分类效率 特征提取 特征向量 特征选择 训练过程 学习器 构建 集合 取出 分类 响应 保证 | ||
【主权项】:
1.一种基于特征强相关的网络流量分类方法,其特征在于:所述方法具体过程为:步骤一:利用特征与响应变量之间的互信息获得预先提取的特征之间的相关性;步骤二:确定特征之间的相关性,根据特征之间的相关性确定特征之间的冗余度,并根据特征之间的冗余度获得每个特征的得分并确定得分最高的特征;按照预先设定的次数m次迭代确定m个得分最高的特征作为最终的特征向量;步骤三:根据分类目标构建分类模型并得到特征强相关网络流量分类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910198841.0/,转载请声明来源钻瓜专利网。