[发明专利]一种基于非负矩阵分解的半监督聚类方法及系统有效
申请号: | 201510508103.3 | 申请日: | 2015-08-18 |
公开(公告)号: | CN105023026B | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 路梅;赵向军;李凡长;张莉 | 申请(专利权)人: | 苏州大学张家港工业技术研究院;苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215699 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非负矩阵 分解 半监督聚类 原始数据 低维 聚类 近似矩阵 聚类结果 先验信息 邻域 原始数据矩阵 评价标准 算法接收 原始空间 互信息 子空间 流形 投影 | ||
本发明公开了一种基于非负矩阵分解的半监督聚类方法,包括:对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵;利用算法接收参数K对原始数据的低维近似矩阵进行聚类,得到聚类结果;利用精确度和互信息两种评价标准对所述聚类结果进行评价。本发明基于非负矩阵分解,不仅考虑了原始数据的邻域保持,同时还考虑了相似性在原始空间和低维流形子空间的一致性,使得聚类性能在先验信息较多的时候大大提高,在先验信息很少的时候依然能保持较好的聚类性能。本发明还公开了一种基于非负矩阵分解的半监督聚类系统。
技术领域
本发明涉及聚类分析技术领域,尤其涉及一种基于非负矩阵分解的半监督聚类方法及系统。
背景技术
近年来非负矩阵分解技术在模式识别和人工智能中起着非常重要的作用。已有研究表明,在心里和生理上都有人脑的基于部分表示的证据。非负矩阵表示在学习类似于人脸,图像和文档等部分表示上有先天的优势。同时,在许多诸如信息检索,计算机视觉和模式识别问题中,数据的特点是维数高,使得直接从样例中学习不可行。研究者们期望对高维数据矩阵分解,得到高维矩阵分解后的低维表示。
非负矩阵分解(nonnegative matrix factorization,NMF)是对非负矩阵分解,找到两个因子矩阵和使得UV的乘积尽可能的和原来的矩阵近似。其中,U可以看作是包含新基的矩阵,V可以看作是原来数据在新基下的表示,由于k<<m,并且k<<n,所以V可以看作是原来矩阵X的低维表示。流形学习自从2000年在《Science》被首次提出以来,已成为信息科学领域的研究热点。基于图正则化的非负矩阵分解(Graph Regularized Nonnegative Matrix Factorization,GNMF)方法,把拉普拉斯图作为一个正则项加入到NMF框架中,有效的利用了原始数据的几何结构,取得了较好的聚类性能。
在数据的聚类应用中,有些数据是有标记的。上述算法都是无监督学习方法,不能有效的利用已有的带标记数据指导聚类,所以在聚类性能上会大打折扣。基于NMF的半监督聚类方法如约束非负矩阵分解(Constrained Nonnegative Matrix Factorization,CNMF),其主要思想是同类的数据映射到投影空间应该有相同的表示。这个方法强制投影空间的表示和原空间的数据有相同类别标记,该方法存在的不足是当已知的标记数据很少时,方法退化为NMF,不能有效的利用原始数据的内部结构,故而聚类性能得不到提升。除此之外,CNMF方法使用不是约束对,而是硬性的标记,这种信息一般很难获得。
发明内容
本发明提供了一种基于非负矩阵分解的半监督聚类方法,该方法基于非负矩阵分解,不仅考虑了原始数据的邻域保持,同时还考虑了相似性在原始空间和低维流形子空间的一致性,使得聚类性能在先验信息较多的时候大大提高,在先验信息很少的时候依然能保持较好的聚类性能。
本发明提供了一种基于非负矩阵分解的半监督聚类方法,包括:
对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵;
利用算法接收参数K对所述原始数据的低维近似矩阵进行聚类,得到聚类结果;
利用精确度和互信息两种评价标准对所述聚类结果进行评价。
优选地,所述对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵具体为:
令所有数据组成的集合为其中xi∈Rm,n是图像的总个数,m是图像样本的维数,并假设图像数据中有NM个must-link约束对和NC个cannot-link约束对;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学张家港工业技术研究院;苏州大学,未经苏州大学张家港工业技术研究院;苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510508103.3/2.html,转载请声明来源钻瓜专利网。