[发明专利]基于欧式距离的自适应集成的不平衡数据分类方法在审
申请号: | 201910832525.4 | 申请日: | 2019-09-04 |
公开(公告)号: | CN110533116A | 公开(公告)日: | 2019-12-03 |
发明(设计)人: | 王宾;陈东;张强;魏小鹏;周昌军 | 申请(专利权)人: | 大连大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 21235 大连智高专利事务所(特殊普通合伙) | 代理人: | 毕进<国际申请>=<国际公布>=<进入国 |
地址: | 116622 辽宁省*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了基于欧式距离的自适应集成的不平衡数据分类方法,首先通过随机平衡方法得到若干个多样性的平衡子集,然后在每个平衡子集上建立得到多个基础分类器。在动态选择算法之前加入了分类器预选择算法。在得到筛选的基础分类器后,提出一种新的动态选择算法,通过评估待分类样本周围区域内的样本分类器情况,当正确分类属于范围内的少数类样本越多则能力越强。最后采用一种基于距离的自适应集成规则将选择出的基础分类器得到的预测结果输出。该方法能够得到在生成多样的子集上建立基础分类器,同时提出动态选择算法能够挑选出分类能力最强的子分类器,最后提出的集成规则能够提供更好的输出结果,最终有效提高了不平衡数据分类精度。 | ||
搜索关键词: | 基础分类 算法 动态选择 集成规则 平衡子集 数据分类 自适应 分类能力 分类样本 欧式距离 输出结果 样本分类 预测结果 周围区域 子分类器 分类器 预选择 子集 样本 多样性 筛选 输出 分类 评估 平衡 | ||
【主权项】:
1.基于欧式距离的自适应集成的不平衡数据分类方法,其特征在于,具体包括如下步骤:/n步骤一、数据预处理,得到多样性平衡子集;/n步骤二、在m个平衡子集上采用同样的分类学习算法得到m个同质分类器构建候选分类器池;/n步骤三、在候选分类器池中预选择基础分类器,将不具有少数类样本能力的分类器删除;/n步骤四、采用动态选择算法从步骤三筛选得到的分类器池中将测试样本周围区域样本分类能力强的候选子分类器挑选出来构成基础分类器集合;/n步骤五、采用一种基于距离的自适应集成规则将选择出的基础分类器集合对于测试样本的预测结果输出。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连大学,未经大连大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910832525.4/,转载请声明来源钻瓜专利网。