[发明专利]不平衡数据集的分类方法在审
申请号: | 201810618637.5 | 申请日: | 2018-06-15 |
公开(公告)号: | CN108830321A | 公开(公告)日: | 2018-11-16 |
发明(设计)人: | 李芳芳;段昱;毛星亮 | 申请(专利权)人: | 中南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410083 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种不平衡数据集的分类方法,包括获取训练数据并得到训练数据的候选频繁项集;对候选频繁项集进行过滤;将候选关联规则分类至规则集合中;衡量规则前件和后件的相关性得到分类关联规则;对得到的分类关联规则进行过滤和排序从而得到分类器;采用分类器对不平衡数据进行分类。本发明方法结合了增比置信度、负关联规则挖掘、增比率和规则强度定义,通过多种因素的结合,能更全面的衡量规则的优先级,因此本发明方法能够在不平衡数据集中有很好的分类效果,在保证整体分类效果的情况下,能够有效提高分类效果,而且本发明方法简单可靠。 | ||
搜索关键词: | 分类 分类效果 关联规则 频繁项集 训练数据 分类器 数据集 过滤 关联规则挖掘 规则分类 规则集合 候选关联 强度定义 数据集中 整体分类 置信度 衡量 后件 前件 排序 保证 | ||
【主权项】:
1.一种不平衡数据集的分类方法,包括如下步骤:S1.获取训练数据,得到训练数据的候选频繁项集;S2.对步骤S1得到的候选频繁项集进行过滤;S3.将候选关联规则分类至相应类别的规则集合中;S4.衡量规则前件和后件的相关性,从而得到各类别相关的分类关联规则;S5.以规则强度作为衡量指标对步骤S4得到的分类关联规则进行过滤和排序,从而得到分类器;S6.采用步骤S5得到的分类器对不平衡数据进行分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810618637.5/,转载请声明来源钻瓜专利网。