[发明专利]一种网络业务流特征选择与分类方法有效
申请号: | 201810169202.7 | 申请日: | 2018-02-28 |
公开(公告)号: | CN108494620B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 董育宁;张咪 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06K9/62 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 业务 特征 选择 分类 方法 | ||
1.基于多目标自适应演化算法的网络业务流特征选择与分类方法,其特征在于,包含以下步骤:
(1)数据收集与预处理:采集互联网上各种多媒体业务的数据流样本,然后进行预处理操作;
(2)特征选择与分析:对上述网络数据流样本的统计特征进行分析,选择有效区分业务流的特征组合,具体包括:
(3.1)采用信息增益率对所有特征进行排序,滤除低于相关性阈值的特征;
(3.2)编码选择:选取长度为特征数量N的二进制编码,每个编码个体由一串比特位组成;任一位都有两个取值,值为1代表选择该特征,值为0代表不选;将每个个体表示为:其中cI∈{0,1},mI∈{0,1};cI和mI分别代表每个编码个体中执行自适应交叉和变异的离散参数;
(3.3)种群初始化:初始化空种群P0,在种群中个体数小于种群大小popsize时,循环执行在[1,N]范围内随机初始化q的值,个体选取信息增益率排名靠前的q个特征,即将对应的前q位置为1,q+1至N位置为0,将该个体加进种群P0;
(3.4)每个个体I有两个适应度函数f1(I)和f2(I),对应于多目标优化的两个目标函数;其中f1(I)为不一致率,f2(I)代表所选特征个数;
(3.5)选择父代:根据个体的拥挤距离来选择父代;
(3.6)自适应交叉:
固定交叉概率pc,对于t代的任两个个体I和J,若pc的概率取1,则将cJ随机置为0或1,并将cJ的值赋给cI;若cJ的值为0,则不交叉,如果为1则执行均匀交叉;
将交叉产生的新个体加入辅助种群Qt中;
(3.7)自适应变异:
固定变异概率pm,对于t代个体I,若pm的概率取1,则将mI随机置为0或1;如果mI的值为0,则不进行变异,如果为1则进行单点翻转变异;
将变异产生的新个体加入Qt代种群中,并将父代Pt和Qt合并为辅助种群Rt;
对种群Rt中的所有个体按照目标函数的等级及拥挤距离进行排序,选取前popsize个个体存活到下一代Pt+1;
执行t=t+1;
(3.8)若满足最大迭代次数gen或在迭代过程中不一致率保持不变,则输出最优特征子集;否则重复步骤(3.4)至步骤(3.7);
(3)业务流分类与检验:利用三层KNN分类器对网络多媒体业务流进行分类实验,得出分类结果,并计算整体分类正确率。
2.根据权利要求1所述的基于多目标自适应演化算法的网络业务流特征选择与分类方法,其特征在于,所述数据收集与预处理操作具体包括:
(2.1)在开放的互联网环境中,通过网络封包分析软件WireShark抓取所需的多媒体业务流数据,然后将原始数据转换成标准的五元组文本格式,所述五元组文本格式包括数据包到达的时间、源IP地址、目的IP地址、协议、数据包分组大小;
(2.2)对原始多媒体业务流的标准五元组文件进行基本的统计特征计算,所述统计特征包括:上/下行包大小、上/下行包大小信息熵、整体包大小、上/下行包到达时间间隔、下行数据包速率、下行字节速率和上下行字节数之比。
3.根据权利要求1所述的基于多目标自适应演化算法的网络业务流特征选择与分类方法,其特征在于,所述不一致率是指:将样本实例中的一个特征组合称为一个模式,特征子集的所有模式的不一致数,为该模式出现的样本总数减去出现次数最多的某一类标签的样本数,不一致率就等于不一致数除以样本总数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810169202.7/1.html,转载请声明来源钻瓜专利网。