[发明专利]基于优化簇相关矩阵的聚类融合方法在审
申请号: | 201710131334.6 | 申请日: | 2017-03-07 |
公开(公告)号: | CN106991433A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 徐占洋;郑克长;周成兵 | 申请(专利权)人: | 南京信息工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 江苏爱信律师事务所32241 | 代理人: | 唐小红 |
地址: | 210044 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优化 相关 矩阵 融合 方法 | ||
1.基于优化簇相关矩阵的聚类融合方法,其特征在于,包括以下步骤:
步骤1),用K-means算法对有N个D维特征数据的集合XND进行M次聚类,最终得到M个有差异的聚类成员;
步骤2),考虑步骤1)得到的M个聚类成员,计算聚类成员间簇与簇的关系Rter和聚类成员内簇与簇的关系Rtra,创建簇相关矩阵CA,计算簇的稳定度S;
步骤3),根据步骤2)得到的簇相关矩阵CA和簇的稳定度S,考虑数据xt落在簇Cmi的概率,根据公式RA(xt,Cmi)=CA(xt,Cmi)×S(Cmi)构造优化簇相关矩阵RA;
步骤4),根据步骤3)得到的优化簇相关矩阵RA,对RA应用多路谱聚类算法:根据优化簇相关矩阵RA,求出对角矩阵D、拉普拉斯矩阵L、L的特征值和与其相对应的特征向量;使用前T个最大特征值对应的特征向量构造新的数据集合UNT,并建立与原始数据集合的对应关系;然后用K-means对UNT进行聚类。
2.根据权利要求1所述的方法,其特征在于,步骤1)用K-means算法每次选取不同的初始聚类中心或设置不同的K值参数,对有N个D维特征数据的集合XND进行M次聚类,最终得到聚类成员集合Π={Π1,Π2,…ΠM}。
3.根据权利要求1所述的方法,其特征在于,步骤2)根据步骤1)得到的聚类成员集合,计算聚类成员间簇与簇的关系其中|Ci|表示簇Ci所包含的数据的数量;根据Rter(Ci,Cj)计算聚类成员内簇与簇的关系其中Cmi表示第m个聚类成员的第i个簇,DC=0.9为衰减系数,Cz是与Ci和Cj在不同聚类成员内且与Ci和Cj组成三元组的簇,Nz是与簇Cz有重叠元素的簇的集合;根据Rtra(Cmi,Cmj)创建簇相关矩阵CA,其中根据簇相关矩阵CA计算簇Cmi的稳定度
4.根据权利要求1所述的方法,其特征在于,步骤3)根据步骤2)得到的簇相关矩阵CA和簇的稳定度S,考虑数据xt落在簇Cmi的概率即数据xt所在簇Cmj与簇Cmi的关系Rtra(Cmi,Cmj)以及簇Cmi的稳定度,根据公式RA(xt,Cmi)=CA(xt,Cmi)×S(Cmi)构造优化簇相关矩阵RA。
5.根据权利要求1所述的方法,其特征在于,步骤4)对根据步骤3)得到的优化簇相关矩阵RA应用多路谱聚类算法:根据步骤3)得到的优化簇相关矩阵RA建立对角矩阵D,D对角线上的值di=∑jRA(i,j)(i≠j)和拉普拉斯矩阵L=D-1/2RAD-1/2;求出拉普拉斯矩阵L的特征值和与其相对应的特征向量;使用前T个最大特征值对应的特征向量构造新的数据集合UNT,即看作原始数据集合X的T维特征,建立该数据集合与原始数据集合的对应关系;最后用K-means对数据集合UNT进行聚类得到最终的聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京信息工程大学,未经南京信息工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710131334.6/1.html,转载请声明来源钻瓜专利网。