[发明专利]一种面向部分标记异质数据的粗糙集属性约简方法在审
申请号: | 202110086066.7 | 申请日: | 2021-01-22 |
公开(公告)号: | CN112765429A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 冀俊忠;张子腾;杨翠翠 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/9035 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 部分 标记 质数 粗糙 属性 方法 | ||
1.一种面向部分标记异质数据的粗糙集属性约简方法,其特征在于,步骤包括:
(1)建立异质粗糙集模型;
引入了如下HEOM距离度量,
其中,m代表数据属性的个数,i代表样本数据m个条件属性中的第i个,wi代表第i个属性的权重,取值为1/m;di(xi,yi)表示样本x与y在第i个属性上的距离,当第i个属性取值为离散型数据时,
当第i个属性取值为连续型数据时,
di(xi,yi)=|xi-yi|
在确定距离度量后,引出异质粗糙集不可分辨关系,建立异质粗糙集;
定义4异质邻域:给定决策系统(U,C,d),C为异质属性集合,对于δ0,x关于属性子集B的异质邻域定义为:
其中,δ是邻域半径,将δ设置为0.2;在HEOM距离度量下,内的样本关于属性子集B是不可分辨的,是x在HEOM距离意义下关于属性子集B的等价类;这里需要特别指出地是,由于使用了HEOM距离度量,在异质邻域下,关于不同属性子集的等价类具有单调性,即
(2)计算等价类粒子结构;
定义了如下一种等价类粒子结构信息来衡量属性子集的分类判别能力;
定义5粒子结构信息:给定部分标记决策系统(Ul∪Uu,C,d),对等价类粒子的结构信息定义为:
其中,Ul和Uu分别表示有标记和无标记的样本集合;
(3)计算广义属性依赖度;
定义6广义依赖度:给定决策系统(Ul∪Uu,C,d),Ul和Uu分别是有标记和无标记数据集,C是异质条件属性集合,决策属性d对属性子集B的广义依赖度定义为:
其中,0≤λ≤1是一个平衡因子,将λ设置为0.5;;
(4)属性约简;
定理2广义依赖度约简定理:给定决策系统(Ul∪Uu,C,d),Ul和Uu分别是有标记和无标记数据集,C是异质条件属性集合,B是C的一个约简当前仅当B满足下面条件:
(1)
(2)
定义7广义重要度:给定决策系统(Ul∪Uu,C,d),Ul和Uu分别是有标记和无标记数据集,C是异质条件属性集合,a相对于属性子集B的广义重要度定义为:
根据广义重要度使用贪心算法选择满足约简定理的属性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110086066.7/1.html,转载请声明来源钻瓜专利网。