[发明专利]基于近似质量与条件熵的属性约简方法在审
申请号: | 201910901262.8 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110674870A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 文辉祥 | 申请(专利权)人: | 文辉祥 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212003*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 近似 度量 约简 条件熵 属性约简 约束条件 邻域粗糙集 启发式算法 单一准则 决策系统 算法融合 求解 邻域 输出 分类 保证 | ||
1.一种基于近似质量与条件熵的属性约简方法,其特征在于:定义近似质量约简为red,所述步骤中red算法包括以下步骤:
步骤1:邻域粗糙集;
在粗糙集理论中,决策系统可以表示为
二元组DS=<U,AT∪{d}>(U是一个非空有限的样本集合,即论域;AT是所有条件属性的集合;{d}是所有决策属性且
给定论域U={x1,x2,…,xn},邻域是建立在某一种度量标准上,通过给定半径考察样本的邻居,不妨假设MA=(rij)n×n为论域上根据属性集合A所得到的距离矩阵,rij表示对象xi与xj之间的距离度量,给定半径σ∈[0,1],可以得到:
其中表示样本xi与U中其他样本距离的最小值,表示样本xi与U中其他样本的距离的最大值,
采用公式(1)的方式考察样本的邻居可以避免因半径过小而产生空邻域的情形,其邻域为:
σA(xi)={xj∈U:xj≠xi,rij≤IntA(xi)}, (2)
定义1:给定一个决策系统DS=<U,AT∪{d}>,X的邻域下近似集与上近似集分别定义如下:
步骤2:度量准则;
d(xi)表示样本xi的类别标记,利用公式(3)可以得到该决策类的下近似集,用以表示确定属于该决策类的样本的集合,可以利用如下定义所示的近似质量来描述论域中的确定性程度,
定义2:给定一个决策系统DS=<U,AT∪{d}>,{d}相对于A的近似质量为:
其中|X|表示集合X的基数,
除了近似质量之外,条件熵也是粗糙集理论中一种常用的用于刻画不确定性的度量方法,以下定义3中给出了邻域条件熵的形式化描述,
定义3:给定一个决策系统DS=<U,AT∪{d}>,{d}相对于A的条件熵为:
其中是σA(xi)是样本xi的邻域,[xi]d是包含样本xi的决策类,
步骤3:属性约简;
属性约简是依据某种度量准则设置一个约束条件,使得删除决策系统中的冗余属性后依然能够满足这一约束,
定义4:给定一个决策系统DS=<U,AT∪{d}>,A被称为一个约简当且仅当φ(A,{d})=φ(AT,{d})且φ(A′,{d})≠φ(AT,{d});
定义4中的φ表示求取约简时所选取的度量准则,观察定义4可知,若给定一种度量准则,约简就是一个能够保持决策系统中这种度量准则不发生变化的最小属性子集,例如,若度量准则为φ(A,{d})=γ(A,{d}),则定义4就是近似质量约简的定义;若度量准则为φ(A,{d})=H(A,{d}),则定义4就是条件熵约简的定义,
邻域利用公式(2)求得,近似质量或条件熵并不随着属性的增加而呈单调变化,约束条件可以设置为“γ(A,{d})≥γ(AT,{d})”或“H(A,{d})≤H(AT,{d})”,
求解约简:定义5:给定一个决策系统DS=<U,AT∪{d}>,属性重要度Sigγ(ak,red,{d})用来反映从条件属性集A中加入属性ak后的近似质量的变化,SigH(ak,red,{d})则用来反映从条件属性集A中加入属性ak后的条件熵的变化,即:
Sigγ(ak,A,{d})=γ(A∪{ak},{d})-γ(A,{d}); (7)
SigH(ak,A,{d})=H(A,{d})-H(A∪{ak},{d}), (8)
完成近似质量约简red输出步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于文辉祥,未经文辉祥许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910901262.8/1.html,转载请声明来源钻瓜专利网。