[发明专利]基于模糊粗糙集条件熵属性约简的数据分析方法在审

专利信息
申请号: 201310616310.1 申请日: 2013-11-27
公开(公告)号: CN103632051A 公开(公告)日: 2014-03-12
发明(设计)人: 贾海涛;张伟;唐建杨;莫祖忠;杨锋 申请(专利权)人: 电子科技大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 成都宏顺专利代理事务所(普通合伙) 51227 代理人: 周永宏
地址: 611731 四川省成*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 模糊 粗糙 条件 属性 数据 分析 方法
【权利要求书】:

1.一种基于模糊粗糙集条件熵属性约简的数据分析方法,其特征在于:包括以下步骤:

S1:将数据的属性构造为一个模糊粗糙集,同时确定数据的模糊决策表其中U是论域,A是由对象的基本属性构成的集合,C为条件属性,D为决策属性,V代表信息函数f的值域;

S2:取一个集合T,并规定它为空集,令这个集合T的最优依赖函数Hbest为0,A的个数i=1;

S3:在每一次判断时,都使得集合T为前一次执行时符合条件的集合T,并使得期望的依赖函数Hpre为最优依赖函数值Hbest

S4:对于每一个其中R是等价关系的集合,计算获得决策属性D和属性的条件熵并判断它与条件熵H(D|T)的大小关系;如果前者小于后者,那么就令集合T为新的集合如果前者大于后者,那么就需要寻找新的更加符合条件的属性集合;

S5:当判断是否为新的数据属性集合时,要判断i个子集A是否已经全部覆盖了集合C-R,如果还没有覆盖完全,即i<基数|C-R|,则让i=i+1,同时重复S4;如果此时i为C-R的基数|C-R|,则进行S6;

S6:当i为C-R的基数|C-R|后,令最优依赖函数Hbest为条件熵H(D|T);

S7:比较期望的依赖函数Hpre与最优依赖函数Hbest的差值是否在规定的误差阈值η范围之内,如果在规定的范围之内则输出约简结果;如果不在规定的范围之内则返回S3重新进行约简。

2.根据权利要求1所述的方法,其特征在于:S1具体步骤如下:输入数据属性模糊决策表DT=(U,A~=CD,V,f);]]>

其中,四元组(U,A,V,f)表示一个信息系统,

U:U={x1,x2,…xn}为论域,由所要研究的对象构成,且

A:A={αjj∈A}是由对象的基本属性构成的集合;

V:V=∪Vj(1≤j≤m)代表信息函数f的值域,Vj为属性αj的值域;

f:f={fj|fj:U→Vj}是信息系统的信息函数,为对象xi赋予相应的值。

3.根据权利要求2所述的方法,其特征在于,S1具体还包括:对于一个决策系统DT=(U,C∪D,V,f),C为条件属性,D为决策属性,则定义

γP(Q)=k=|posP(Q)|/|U|       (1)

为属性Q依赖于属性P的程度;其中为属性Q的P正域,所述的正域所包含的对象是指被划分到Q的等价类中去的P的等价类里的对象;|U|表示集合U的基数。

4.根据权利要求3所述的方法,其特征在于:S2具体如下:重新定义数据的模糊属性和划分论域U结果为为了与原定义的模糊等价类集合X1,X2,…,Xn进行区分,将原集合定义为同理根据模糊粗糙集中引入的模糊集隶属度函数,对于xk∈U,它属于模糊等价类的隶属度也可以表示为属于该等价类的概率,那么出现的概率就可以通过各对象的隶属度决定,也就是

p(X~i)=ΣxkUμX~i(xk)ΣX~lXΣxkUμX~l(xk),i=1,2,···,n---(2)]]>

同理可以得到

p(Y~i)=ΣxkUμY~i(xk)ΣY~lXΣxkUμY~l(xk),j=1,2,···,n---(3)]]>

为了推导联合概率的表达式,得到集合{P,Q}划分论域U的结果,即

U/A={Z~l=X~rY~t|X~rU/P~,Y~tU/Q~}---(4)]]>

其中,1≤r≤n,1≤t≤m;通过隶属度,联合概率可以改写为

p(X~iY~j)=ΣxkUμX~iY~j(xk)ΣZ~lU/{P,Q}ΣxkUμZ~l(xk)---(5)]]>

其中,

μZ~l(xk)=μX~rY~t(xk)=min(μX~r(xk),μY~t(xk))---(6)]]>

由于每个对象只以0或者1属于Q的等价类所以根据式(6),可把联合概率改写为

p(X~iY~j)=ΣxkUμX~iY~j(xk)ΣX~lXΣxkUμX~l(xk)---(7)]]>

那么,Q相对P的条件熵可以变为:

H(Q|P)=-Σi=1np(X~i)Σj=1mp(Y~j|X~i)logp(Y~j|X~i)]]>

=-Σi=1np(X~i)Σj=1mp(X~iY~j)p(X~i)logp(X~iY~j)p(X~i)---(8)]]>

=-Σi=1nΣxkUμX~i(xk)ΣX~lXΣxkUμX~l(xk)Σj=1mΣk=1|U|μX~iY~j(xk)Σk=1|U|μX~i(xk)logΣk=1|U|μX~iY~j(xk)Σk=1|U|μX~i(xk)]]>

依赖函数是条件熵的值,从而得到了依赖函数,在此基础上进行属性约简。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310616310.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top