[发明专利]一种基于特征选择的分类改进算法在审
申请号: | 202111114271.6 | 申请日: | 2021-09-23 |
公开(公告)号: | CN113837271A | 公开(公告)日: | 2021-12-24 |
发明(设计)人: | 刘兴惠;李至立;孙铭;方玉洁 | 申请(专利权)人: | 山东纬横数据科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/10;G06N20/20 |
代理公司: | 北京贵都专利代理事务所(普通合伙) 11649 | 代理人: | 李新锋 |
地址: | 264000 山东省烟台市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 特征 选择 分类 改进 算法 | ||
1.一种基于特征选择的分类改进算法,其特征在于,由SVM-REF特征选择方法和Bagging-AdaBoost分类模型的算法集成为所述的SRBA模型,所述SRBA模块包括有两个功能模块:首先进行数据预处理,使用SVM-RFE对数据特征进行权重重要性排序,筛选出指定数量的特征作为模型输入;然后搭建Bagging-AdaBoost分类模型,将集成学习技术应用于事物类型划分中。
2.根据权利要求1所述的一种基于特征选择的分类改进算法,其特征在于,所述的一种基于特征选择的分类改进算法,具体分为以下步骤:
(1)数据预处理;
(2)SVM-REF特征选择;
(3)集成分类识别。
3.根据权利要求2所述的一种基于特征选择的分类改进算法,其特征在于,步骤(1)所述的数据预处理具体为以下步骤:
1.1填补缺失值;
1.2归一化。
4.根据权利要求3所述的一种基于特征选择的分类改进算法,其特征在于,步骤(2)所述的特征选择具体为以下步骤:
2.1通过SVM模型训练特征,得到特征对应的权重,计算特征权重排序列表,每次迭代剔除1个特征权重排名最低的特征。
2.2用剩余的特征再次训练模型获取新的特征权重,迭代执行这一过程,直到所有特征被剔除,得到所有特征属性的递减顺序排序表,最后根据业务需求选出需要的特征数目,为之后的训练数据集、测试数据集确定好特征参考。
5.根据权利要求4所述的一种基于特征选择的分类改进算法,其特征在于,步骤(3)所述的集成分类识别具体为以下步骤:
3.1对个数为N的训练数据集执行k轮Bagging算法中的bootstrap方法,在每一轮随机采样中,有放回提取n个训练样本形成k组独立的训练子集;
3.2使用AdaBoost算法作为新的基分类器来并行训练学习子集,均采用同质基分类器——CART决策树对不同的训练子集分别执行AdaBoost算法流程,发展k组独立的强学习器,得到不同的分类结果;
3.3对学习器的分类结果进行简单投票得到最终结果,作为SRBA算法模型的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东纬横数据科技有限公司,未经山东纬横数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111114271.6/1.html,转载请声明来源钻瓜专利网。