[发明专利]一种基于非负矩阵分解的半监督聚类方法及系统有效

申请号：	201510508103.3	申请日：	2015-08-18
公开（公告）号：	CN105023026B	公开（公告）日：	2018-08-17
发明（设计）人：	路梅;赵向军;李凡长;张莉	申请（专利权）人：	苏州大学张家港工业技术研究院;苏州大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	北京集佳知识产权代理有限公司 11227	代理人：	常亮
地址：	215699 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	非负矩阵分解半监督聚类原始数据低维聚类近似矩阵聚类结果先验信息邻域原始数据矩阵评价标准算法接收原始空间互信息子空间流形投影
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于非负矩阵分解的半监督聚类方法，其特征在于，包括：

对原始数据矩阵作非负矩阵分解投影，得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵；

利用算法接收参数K对所述原始数据的低维近似矩阵进行聚类，得到聚类结果；

利用精确度和互信息两种评价标准对所述聚类结果进行评价；

所述对原始数据矩阵作非负矩阵分解投影，得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵具体为：

令所有数据组成的集合为其中x_i∈R^m，n是图像的总个数，m是图像样本的维数，并假设图像数据中有N_M个must-link约束对和N_C个cannot-link约束对；

构造由所有顶点构成的p-邻域图，并使用cannot-link约束对进行修正，如果两个顶点满足cannot-link约束，同时又是p-邻域顶点，则从p-邻域图中删除这两个顶点形成的边，其中，边上的权重定义为：

构造由must-link约束对构成的相似图，其中，边上的权重定义为：

利用公式对非负矩阵分解进行优化，得到投影以后的新空间的基U和原始数据在新空间的投影V，其中，λ_W和λ_S均为参数；

定义简化后得到：

F＝||X-UV^T||²+λ_WTr(V^TL_WV)+λ_STr(V^TL_SV)；

利用拉格朗日最小二乘法，分别对U和V求偏导，得到U和V的迭代公式；

利用迭代公式求U和V直至收敛；

x_j的定义与x_i的定义相同，x_j∈R^m，N_p(x_s)为x_s的p_-邻域集(s＝i,j)，C_cl为属于不同类的约束对的集合，C_ml为属于同类的约束对集合，X是原始数据矩阵，X∈R^m×n，v_s为矩阵V的第s列(s＝i,j)，L_W，L_S为矩阵W和S的拉普拉斯矩阵，Tr()表示求矩阵迹。