[发明专利]一种基于非负矩阵分解的半监督聚类方法及系统有效
申请号: | 201510508103.3 | 申请日: | 2015-08-18 |
公开(公告)号: | CN105023026B | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 路梅;赵向军;李凡长;张莉 | 申请(专利权)人: | 苏州大学张家港工业技术研究院;苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 215699 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非负矩阵 分解 半监督聚类 原始数据 低维 聚类 近似矩阵 聚类结果 先验信息 邻域 原始数据矩阵 评价标准 算法接收 原始空间 互信息 子空间 流形 投影 | ||
1.一种基于非负矩阵分解的半监督聚类方法,其特征在于,包括:
对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵;
利用算法接收参数K对所述原始数据的低维近似矩阵进行聚类,得到聚类结果;
利用精确度和互信息两种评价标准对所述聚类结果进行评价;
所述对原始数据矩阵作非负矩阵分解投影,得到既有邻域保持又有相似性保持的原始数据的低维近似矩阵具体为:
令所有数据组成的集合为其中xi∈Rm,n是图像的总个数,m是图像样本的维数,并假设图像数据中有NM个must-link约束对和NC个cannot-link约束对;
构造由所有顶点构成的p-邻域图,并使用cannot-link约束对进行修正,如果两个顶点满足cannot-link约束,同时又是p-邻域顶点,则从p-邻域图中删除这两个顶点形成的边,其中,边上的权重定义为:
构造由must-link约束对构成的相似图,其中,边上的权重定义为:
利用公式对非负矩阵分解进行优化,得到投影以后的新空间的基U和原始数据在新空间的投影V,其中,λW和λS均为参数;
定义简化后得到:
F=||X-UVT||2+λWTr(VTLWV)+λSTr(VTLSV);
利用拉格朗日最小二乘法,分别对U和V求偏导,得到U和V的迭代公式;
利用迭代公式求U和V直至收敛;
xj的定义与xi的定义相同,xj∈Rm,Np(xs)为xs的p-邻域集(s=i,j),Ccl为属于不同类的约束对的集合,Cml为属于同类的约束对集合,X是原始数据矩阵,X∈Rm×n,vs为矩阵V的第s列(s=i,j),LW,LS为矩阵W和S的拉普拉斯矩阵,Tr()表示求矩阵迹。
2.根据权利要求1所述的方法,其特征在于,所述利用精确度和互信息两种评价标准对所述聚类结果进行评价具体为:
对数据点di,令li和αi分别代表数据的原始标记和非负矩阵分解算法得到的标记,定义精确度:
其中,n是图像的总个数,函数map(li)把得到的类别标记li映射为数据集中相应的标记αi,δ(x,y)是delta函数,定义为:
定义互信息:
其中,p(ci)和p(c'j)分别表示从数据集中随机抽取的数据属于聚类ci和c'j的概率,p(ci,c'j)表示数据同时属于聚类ci和c'j的联合概率;
利用归一化互信息,定义其中,H(C)和H(C')分别是C和C'的熵。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学张家港工业技术研究院;苏州大学,未经苏州大学张家港工业技术研究院;苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510508103.3/1.html,转载请声明来源钻瓜专利网。