[发明专利]一种决策表下近似不变的局部属性约简定义及方法在审
申请号: | 201710711941.X | 申请日: | 2017-08-18 |
公开(公告)号: | CN107463707A | 公开(公告)日: | 2017-12-12 |
发明(设计)人: | 李吉梅;刘贵龙;花正;冯艳宾;邹继阳 | 申请(专利权)人: | 北京语言大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06N5/02 |
代理公司: | 北京市广友专利事务所有限责任公司11237 | 代理人: | 张仲波 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 决策 近似 不变 局部 属性 定义 方法 | ||
技术领域
本发明涉及数据挖掘、知识发现、模式识别与机器学习技术领域,特别是一种决策表下近似不变的局部属性约简定义及方法。
背景技术
属性约简也称之为特征选取,来源于机器学习。属性约简在许多领域都有重要的应用,例如辅助决策、数据挖掘、模式识别等领域。
2016年,X.Jia等学者总结了22种属性约简类型,包括正区域约简、分布约简、变精度约简、覆盖约简、交互信息约简和代价敏感性约简。实际上,约简的类型有更多。但目前,针对属性约简问题的研究,基本上属于对决策属性值的整体约简范畴。
一般说来,要计算出信息系统所有的约简,目前只能通过分辨矩阵的方法来实现,其基本的算法由波兰学者Skowron和Rauszer给出,大体上通过以下三个步骤来实现:
(1)计算分辨矩阵;
(2)将分辨函数从其主合取范式(conjunctive normal form,CNF)转换为主析取范式(disjunctive normal form,DNF);
(3)得出所有约简。
但该算法的计算复杂性较高,S.K.Wong和W.Ziarko在1985年已经证明:找出一个信息系统或决策表的所有属性约简子集,是一个NP-hard问题,其中,NP表示非确定性多项式(Non-deterministic Polynomial)。这是由数据组合爆炸引起的,不存在统一、规范的高效方法。
发明内容
本发明要解决的技术问题是提供一种决策表下近似不变的局部属性约简定义及方法,以解决现有技术所存在的计算复杂性高的问题。
为解决上述技术问题,本发明实施例提供一种决策表下近似不变的局部属性约简定义,包括:
获取决策表(U,C∪D),其中,U表示论域,C表示条件属性集,D表示决策属性集,C和D均为U上的等价关系的集合;
确定论域U关于决策属性集D的商集为U/D={D1,D2,…,Dk},其中,Dl表示决策表的第l个决策类,l的取值为l∈{1,2,……,k},k为正整数;
设集合B为集合C的非空子集:对于给定的正整数l∈{1,2,……,k},若B满足:
(1)RC(Dl)=RB(Dl),其中,RC(Dl)表示保持决策类Dl的等价关系RC的下近似不变的对应元素x的集合,RB(Dl)表示保持决策类Dl的等价关系RB的下近似不变的对应元素x的集合,x∈U;
(2)若则RC(Dl)≠RB′(Dl),其中,集合B′为集合B的非空真子集,RB′(Dl)表示表示决策类Dl的等价关系RB’的下近似不变的对应元素x的集合,x∈U;
则称B为C的关于决策类Dl的下近似不变的局部属性约简。
进一步地,所述其中,[x]C为包含x的关于等价关系RC的等价类;
所述其中,[x]B为包含x的关于等价关系RB的等价类;
所述其中,[x]B’为包含x的关于等价关系RB’的等价类。
本发明实施例还提供一种根据所述决策表下近似不变的局部属性约简定义确定的局部属性约简方法,包括:
基于保持决策表下近似不变的属性约简算法,计算决策表的Dl决策类的分辨矩阵,其中,Dl为用于局部属性约简的决策类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京语言大学,未经北京语言大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710711941.X/2.html,转载请声明来源钻瓜专利网。