[发明专利]一种基于粗糙集中DRICA的规则提取方法在审
申请号: | 201710524236.9 | 申请日: | 2017-06-30 |
公开(公告)号: | CN107403190A | 公开(公告)日: | 2017-11-28 |
发明(设计)人: | 代建华;高帅超;郑国杰 | 申请(专利权)人: | 天津大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 天津市北洋有限责任专利代理事务所12201 | 代理人: | 刘玥 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 粗糙 集中 drica 规则 提取 方法 | ||
技术领域
本发明属于智能决策系统中的数据挖掘技术,涉及一种规则提取方法,具体是指一种基于粗糙集中DRICA的规则提取方法。
背景技术
现实中由于数据采集的结果往往伴随着噪声数据,这使得不确定数学工具显得尤为重要。粗糙集理论与其他处理不确定和不精确问题理论相比,无需提供问题所需处理的数据集合之外的任何先验知识。由于粗糙集处理不确定数据的优越性,目前已经在分类、聚类等多个领域得到广泛应用,其中,决策规则提取是最为重要的应用之一。
在基于粗糙集的决策规则方法中,规则提取方法LEM2凭借其更为出众的获取结果,被越来越广泛的使用。LEM2方法搜索属性-值对空间,选择覆盖率最大的属性-值对,也就是说LEM2方法从属性-值对的观点提取规则,但在一些情况下,从属性的观点提取规则更合理。规则提取方法DRICA(JianHua Dai,Haowei Tian,Wentao Wang,Liang Liu.Decision rule mining using classification consistency rate[J].Knowledge-Based Systems,2013,43(2):95–102.)从属性的观点提取规则,而且不需要提前进行属性约简,属性约简和规则提取同时进行。
但规则提取方法DRICA:(1)DRICA遍历一次未选择属性集,从中选择属性,然后再提取规则和删减被规则覆盖的对象,使得一个对象只能被用来提取一次规则;而在一些情况,一个对象被多次用来提取规则更合理。(2)粗糙集中含有缺失值的决策表称作不完备决策表,DRICA未考虑对不完备决策表的处理,不能直接处理不完备决策表,而现实中的数据往往存在着缺失值。基于上面的背景,需要提出一种规则提取方法,使得一个对象可以被多次用来提取规则,而且适用于不完备决策表。
发明内容
本发明要解决的技术问题是提供一种基于粗糙集中DRICA的规则提取方法,该方法具有DRICA方法的优点,而且使得一个对象可以被多次用来提取规则和适用于不完备决策表。
为了解决上述技术问题,本发明采用的技术方案为:1、一种基于粗糙集中DRICA的规则提取方法,其特征在于,包括如下步骤:
步骤一,通过不完备决策表数据给出一个决策类的上(下)近似集B;一个用户感兴趣的属性集A;全部条件属性C;
步骤二,令已选择的属性集SA的初始值为A,未选择的属性集UA的初始值为C-A,规则集RULES的初始值空集,近似集B中未被规则集RULES覆盖的对象G的初始值为B;
步骤三,判断G是否为空集,如果满足条件,执行结束,输出规则集RULES;否则,进入步骤四;
步骤四,对未选择属性集UA中的每个属性a′计算P=(SA∪a′RB∩G);同时按照max|SA∪aRB∩G|的条件获得选择属性a;即选择|P|值最大的属性;令已选择的属性集SA=SA∪a,未选择的属性集UAUUA–a;
步骤五,按照属性集合SA∪a′从P中提取规则获得规则集rules;并对规则集rules中的每条规则r进行约简;
a、对规则r中某个属性值对(a,v)进行删除后,
b、判断规则r覆盖的对象集是否为B的子集,若是,令r=r–{(a,v)};
c、将提取到的规则rules添加到规则集RULES中。
步骤六,令G=G–∪s∈{RULES}[s];
步骤七,判断,近似集B的已选择属性SA的下近似SARB和近似集B的全部属性C的下近似CRB是否相等,若满足相等,则结束,输出规则集RULES;否则,返回步骤三。
所述步骤一中不完备决策表数据,即给定一个决策表DT=(U,C∪D,V,f),如果存在x∈U,a∈C,fa(x)是一个缺失值(缺失值表示为“*”),则该决策表被称做不完备决策表;假设fd(x)为非缺失值。一个不完备决策表可表示为IDT=(U,C∪D,V,f,*∈VC=∪a∈CVa,所述步骤一中不完备决策表中决策类的上(下)近似集B通过公式得到,公式(1)是下近似,公式(2)为上近似。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710524236.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于朴素贝叶斯分类器的风偏闪络预警方法
- 下一篇:发卡机及自动柜员机