[发明专利]一种基于信息熵权重两支决策优化的数据聚类集成方法在审
申请号: | 201810810658.7 | 申请日: | 2018-07-23 |
公开(公告)号: | CN109241992A | 公开(公告)日: | 2019-01-18 |
发明(设计)人: | 徐健锋;王文国;刘斓;梁伟;吴俊杰 | 申请(专利权)人: | 南昌大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南昌新天下专利商标代理有限公司 36115 | 代理人: | 施秀瑾 |
地址: | 330031 江西省*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 决策优化 数据聚类 信息熵 权重 聚类集合 决策思想 算法处理 局部权 鲁棒性 | ||
1.一种基于信息熵权重两支决策优化的数据聚类集成方法,其特征在于,包括以下步骤:
(1)集成聚类成员初步生成;
(2)基于两支决策思想的局部权重算法处理基础聚类成员;
(3)基于最终的基础聚类集合的聚类集成;
(4)结束。
2.根据权利要求1所述的一种基于信息熵权重两支决策优化的数据聚类集成方法,其特征在于,步骤(1)所述集成聚类成员初步生成,其步骤为:
1)利用数据聚类算法对数据集D={d1,d2,...,dx}做聚类操作;
2)将聚类次数控制参数m置初值为1;
3)判断控制参数m是否小于或等于备选聚类成员个数M,是则执行步骤4,否则转到步骤6);
4)得到第m次聚类记为其中集合πm的基数个数为|πm|记为Nm;
5)将控制参数m执行m=m+1,然后转到步骤3);
6)生成备选的备选聚类集合将所有备选聚类成员Π={π1,π2,...,πM}标上不确定标记;
7)结束。
3.根据权利要求1所述的一种基于信息熵权重两支决策优化的数据聚类集成方法,其特征在于,步骤(2)所述基于两支决策思想的局部权重算法处理基础聚类成员,其步骤为:
1)设置控制参数r初值为1,设置循环次数限制k;
2)判断控制参数r是否小于或等于k,若是则执行下一步骤,否则将Π中所有元素都标上确定标记并且转到步骤10;
3)计算Π={π1,π2,...,πM}中标有不确定标记聚类的任何一个类簇πm∈Π,相对于Π中所有聚类的不确定信息熵,其计算公式为:其中1≤m≤M,1≤n≤NM;1≤μ≤M,1≤j≤NM,|*|为集合*的元素个数;
4)计算步骤3中得到的πm中每个类簇的平均值;
其计算公式为:其中Nm=|πm|;
5)计算步骤3中得到的备选聚类πm中的标准差;
其计算公式为:
6)使用公式W(*)=e-*归一化获得每个聚类中类簇的不确定信息熵平均值Ψ(πm)和标准差σ(πm),作为每个聚类的二种权重W(Ψ(πm))和W(σ(πm)),使得二个权重的取值区间为(0,1];
7)设定权重W(Ψ(πm))的阈值为α和权重W(σ(πm))的阈值为β;
8)将步骤6中计算得出的所有备选聚类的W(Ψ(πm))与α进行比较,W(σ(πm))与β进行比较;
若某聚类πm∈Π满足以下两个条件之一:
a)(W(Ψ(πm))>α)∧(W(σ(πm))<β)
b)((W(Ψ(πm))<α)∧(W(σ(πm))<β))或((W(Ψ(πm))>α)∧(W(σ(πm))>β))
则保留该聚类,并将不确定标记修改为确定标记;
若某聚类πm∈Π存在(W(Ψ(πm))<α)∧(W(σ(πm))>β)的情况,则从Π={π1,π2,...,πM}中删除这个聚类,并记录删除的聚类的个数t;
9)将步骤8中所有保留的备选聚类数量重新记为M,则保留的备选聚类记为Π={π1,π2,...,πM},若此时步骤8中t等于0,则转到步骤10;否则将控制参数r加1,返回步骤2;
10)得到最终的基础聚类集合Π={π1,π2,...,πM}。
4.根据权利要求1所述的一种基于信息熵权重两支决策优化的数据聚类集成方法,其特征在于,步骤(3)所述的基于最终的基础聚类集合的聚类集成,其步骤为:
1)基于上述获得基础聚类中类簇的权重信息,计算数据集D中任意二个元素出现在各个聚类同一类簇中的次数及其与该类簇权重的乘积作为任意二个元素间的带权集成距离;
其中di∈D,dj∈D并且di≠dj,
Cnm为聚类πm中di所在的类簇,记为di∈Cnm,Cnm∈πm,n∈[1,Nm];
wim等于
如果di∈Cnm时,dj也属于聚类πm中的类簇Cnm时Φijm=1
如果di∈Cnm时,dj不属于聚类πm中的类簇Cnm时Φijm=0
2)基于步骤1)获得的数据集D={d1,d2,…dx}中任意二个元素间的带权集成距离Dis(di,dj)作为层次聚类方法中元素间的聚类距离;对数据集D实施层次聚类,并获得最后的集成聚类输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌大学,未经南昌大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810810658.7/1.html,转载请声明来源钻瓜专利网。