[发明专利]一种基于非负矩阵分解的半监督聚类方法及系统有效
申请号: | 201510508103.3 | 申请日: | 2015-08-18 |
公开(公告)号: | CN105023026B | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 路梅;赵向军;李凡长;张莉 | 申请(专利权)人: | 苏州大学张家港工业技术研究院;苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215699 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于非负矩阵分解的半监督聚类方法,包括:对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵;利用算法接收参数K对原始数据的低维近似矩阵进行聚类,得到聚类结果;利用精确度和互信息两种评价标准对所述聚类结果进行评价。本发明基于非负矩阵分解,不仅考虑了原始数据的邻域保持,同时还考虑了相似性在原始空间和低维流形子空间的一致性,使得聚类性能在先验信息较多的时候大大提高,在先验信息很少的时候依然能保持较好的聚类性能。本发明还公开了一种基于非负矩阵分解的半监督聚类系统。 | ||
搜索关键词: | 非负矩阵 分解 半监督聚类 原始数据 低维 聚类 近似矩阵 聚类结果 先验信息 邻域 原始数据矩阵 评价标准 算法接收 原始空间 互信息 子空间 流形 投影 | ||
【主权项】:
1.一种基于非负矩阵分解的半监督聚类方法,其特征在于,包括:对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵;利用算法接收参数K对所述原始数据的低维近似矩阵进行聚类,得到聚类结果;利用精确度和互信息两种评价标准对所述聚类结果进行评价;所述对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵具体为:令所有数据组成的集合为其中xi∈Rm,n是图像的总个数,m是图像样本的维数,并假设图像数据中有NM个must‑link约束对和NC个cannot‑link约束对;构造由所有顶点构成的p‑邻域图,并使用cannot‑link约束对进行修正,如果两个顶点满足cannot‑link约束,同时又是p‑邻域顶点,则从p‑邻域图中删除这两个顶点形成的边,其中,边上的权重定义为:构造由must‑link约束对构成的相似图,其中,边上的权重定义为:利用公式对非负矩阵分解进行优化,得到投影以后的新空间的基U和原始数据在新空间的投影V,其中,λW和λS均为参数;定义简化后得到:F=||X‑UVT||2+λWTr(VTLWV)+λSTr(VTLSV);利用拉格朗日最小二乘法,分别对U和V求偏导,得到U和V的迭代公式;利用迭代公式求U和V直至收敛;xj的定义与xi的定义相同,xj∈Rm,Np(xs)为xs的p‑邻域集(s=i,j),Ccl为属于不同类的约束对的集合,Cml为属于同类的约束对集合,X是原始数据矩阵,X∈Rm×n,vs为矩阵V的第s列(s=i,j),LW,LS为矩阵W和S的拉普拉斯矩阵,Tr()表示求矩阵迹。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学张家港工业技术研究院;苏州大学,未经苏州大学张家港工业技术研究院;苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510508103.3/,转载请声明来源钻瓜专利网。