[发明专利]一种基于特征选取的SVM级联分类器方法有效
申请号: | 201610121109.X | 申请日: | 2016-03-03 |
公开(公告)号: | CN105809190B | 公开(公告)日: | 2019-11-19 |
发明(设计)人: | 董育宁;赵小祥 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 32207 南京知识律师事务所 | 代理人: | 汪旭东<国际申请>=<国际公布>=<进入 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于特征选取的SVM级联分类器方法,包括在开放的网络环境中获取网络游戏与网络视频业务数据,并对该数据流进行基本的流量统计特征计算。然后基于特征选取的SVM级联分类器方法,确定每一级SVM分类器需要识别出的数据类型,以及能有效区分出该类型数据与其他类型数据的最佳特征组合。最后根据设计出的SVM级联分类器对原始的网络数据流进行分类实验,并通过多次实验得到最后的分类结果。本方法在进行特征选取的过程中综合考虑了信息增益率和皮尔森相关系数指标,从而能更为准确地选取最佳特征组合,以提高分类性能。而且本方法采用了为每一类型的数据单独选取最佳特征组合的思想,配合有效的特征选取方法,能有效地提高分类正确率。 | ||
搜索关键词: | 一种 基于 特征 选取 svm 级联 分类 方法 | ||
【主权项】:
1.一种基于特征选取的SVM级联分类器方法,其特征在于包括以下步骤:/n步骤1:在开放的网络环境中获取所需的网络游戏与网络视频业务数据,并对该数据流进行基本的流量统计特征计算;/n步骤2:利用基于特征选取的SVM级联分类器方法,确定每一级SVM分类器需要识别出的数据类型,以及能有效区分出该类型数据与其他类型数据的最佳特征组合,具体步骤为:/n步骤3-1)对于样本空间P,由k种不同类型的数据组成,用矩阵S表示,共需设计出k-1级SVM分类器,首先设计第一级SVM分类器;/n步骤3-2)对矩阵S进行无量纲化处理,由于实际环境中,大部分流统计特征的量级不同,首先对矩阵S中的元素进行无量纲化处理;/n步骤3-3)随机选取训练集和测试集,从矩阵S的每种类型数据中随机选取出一定比例构成训练集S1,剩余的数据构成测试集S2;/n步骤3-4)选取待识别类,修改类属性,选取矩阵S中的第一类数据作为待识别类,将训练集S1和测试集S2中对应待识别类的类属性改为1,其他类数据的类属性改为-1;/n步骤3-5)离散化处理,以基于信息熵的连续型数据离散化方法,对训练集S1中的数据进行离散化处理;/n步骤3-6)皮尔森相关系数和信息增益率的计算,计算离散后的训练集S1中特征与类之间以及特征内部之间的皮尔森相关系数和信息增益率;/n步骤3-7)去除不相关特征,根据特征与类之间的信息增益率,对特征进行降序排列,去除信息增益率取值为0-0.5范围的特征;/n步骤3-8)去除冗余特征,去除不相关特征后,依次对剩余特征进行两两比较,对于任意两个特征,若两者显著相关,则去除排序靠后者,显著相关的判断方法为:若这两个特征均符合皮尔森相关系数的适用条件,即这两者之间存在线性关系且均符合或近似符合正态分布,则采用皮尔森相关系数表示两者的相关程度;若不符合,则采用信息增益率表示,若相关程度的指标值大于等于0.7,则认为这两个特征显著相关;/n步骤3-9)选取每次实验的最佳特征组合,去除冗余特征后,选取前两名特征作为本次实验待识别类的最佳特征组合,记录下每次实验的最佳特征组合;/n步骤3-10)分类实验,以训练集S1和最佳特征组合作为输入,训练出能够区分该待识别类和其他类数据的SVM分类器,训练完成后,以测试集S2作为输入验证SVM分类器的正确性,同时记录下每次实验的正确率;/n步骤3-11)分类正确率与最佳特征组合的选取,为了正确反映SVM分类器区分待识别类与其他类数据的正确率,重复M次步骤3-3至3-10中的实验,这M次实验中,每次实验均选取同一种数据为待识别类,计算M次实验的平均分类正确率作为区分该待识别类对应的分类正确率指标,从M次实验记录下的最佳特征组合中选择出现次数最多的两个特征,作为该待识别类最终的最佳特征组合;/n步骤3-12)重新选取待识别类,依次选取其他类型的数据作为待识别类,重复步骤3-3至3-11,记录下每个待识别类对应的分类正确率指标和最佳特征组合;/n步骤3-13)选取出第一级SVM分类器需要识别出的数据,根据每个待识别类对应的分类正确率指标,选取出分类正确率最高的待识别类作为第一级SVM分类器需要识别出的数据类型,同时记录下该类型数据对应的最佳特征组合;/n步骤3-14)依次设计下一级SVM分类器,去除矩阵S中第一级SVM分类器需要识别出的数据类型,以步骤3-3至3-13的方法设计第二级SVM分类器,以类似方法依次设计下一级SVM分类器;/n步骤3:根据设计出的SVM级联分类器对原始的网络数据流进行分类实验,通过多次实验得到最后的分类结果。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610121109.X/,转载请声明来源钻瓜专利网。
- 上一篇:优化场形四极杆
- 下一篇:情感分类的方法及系统