[发明专利]基于非负矩阵分解和划分自适应融合的多视角聚类方法有效
申请号: | 201911332635.0 | 申请日: | 2019-12-22 |
公开(公告)号: | CN111191699B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 陶性留;俞璐;王晓莹;姚艳艳 | 申请(专利权)人: | 中国人民解放军陆军工程大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/26 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 王玮 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 矩阵 分解 划分 自适应 融合 视角 方法 | ||
本发明公开了一种基于非负矩阵分解和划分自适应融合的多视角聚类方法。针对多视角聚类任务如何更好地实现视图间的学习,提出一种新的视角融合策略,该策略首先为每个视角设置一个划分,然后通过自适应学习获取一个融合权重矩阵对每个视角的划分进行自适应融合,最终利用视角集成方法得到全局划分结果。将上述策略应用于经典的FCM模糊聚类框架中,采用交替方向乘法器优化模型(Alternating Direction Method of Multipliers,ADMM)求解。与几种相关聚类算法相比,本发明的方法在处理多视角聚类任务时具有更好的适应性和聚类。
技术领域
本发明涉及数据挖掘和模式识别技术领域和数据分析与人工智能领域,具体是一种基于非负矩阵分解和划分自适应融合的多视角聚类方法。
背景技术
近年来,互联网信息技术在现实生活中得到了迅速发展和广泛应用,使信息和数据呈现爆炸式增长。在描述一些实际问题的过程中,同样的事情可以用不同的方式,从不同的角度或不同的形式来描述。各种描述称为事物的多个视图,数据称为多视图数据[1]。每个单独的视图都足以挖掘知识,从多个视图中组合有价值的信息可以提高性能和质量。然而,主要的挑战是如何集成这些多个表示或视图提供的独立兼容和互补的信息,并为诸如集群和分类等任务提供所有视图之间的参考解决方案。
多视图聚类的目标是根据对象的多个表示形式将对象划分为多个集群。聚类算法的基本思想是将一组数据对象按照一定的准则进行分组,将相似的对象分组到同一个集群中,将不同的对象分组到不同的集群中。多视角聚类算法己被证实优于单视图聚类算法,且具有更好的稳定性,更低的时间复杂度。在1998年,由Bulum和Mitchell提出的Co-training开启了多视角学习的先河。随后,多视角聚类算法如雨后春笋般大量出现,根据其内容的不同,可大致地分成四类:Co-training,多核学习,子空间学习和多视角图学习。Co-training这类方法使用协同训练策略来处理多视角数据,着力于最大化两个不同的视图间的一致性。它通过使用已有的或相互学习的知识来引导不同视图的聚类。通过迭代执行该策略,所有视图的聚类结果趋于彼此,这将导致所有视图之间达成最广泛的共识。多核学习方法使用是将不同视图对应的预定义内核,然后线性或非线性地组合这些内核,以提高聚类性能。子空间学习通过假设所有视图共享一个表示,从所有视图的所有特性子空间中学习统一的特性表示,输入到用于聚类的模型中。多视角图学习即寻找一个跨所有视图的融合图(或网络),然后在融合图上使用图割算法或其他技术(如谱聚类)来产生聚类结果。2012年,Tzortzis等人针对不同的视角,通过核函数进行相应加权聚类,发现不同视角在更加合适的权重下可以得到更高的精度。2009年,Chaudhur等人通过典型相关分析提取两个视角的共享信息将其作为本质特征进行聚类,从而提出了一种基于典型相关分析的多视角聚类算法。2016年,Zhang等人通过利用各视角中样本与样本的关联程度去学习的几何图结构,提出了一种基于超图正则化非负矩阵分解的多视角聚类算法。
人们获得的数据普遍具有如下两个特点:(1)数据量庞大,检索困难;(2)数据维数巨大,处理困难。虽然高维数据也许含有更多的信息,但将其直接用于分类、聚类或概率密度估计等任务,必将付出巨大的时间和空间代价。因此降维特征提取过程已经成为许多数据挖掘问题的一种预处理手段。数据降维的本质是寻找一个低维表示来反映原始数据的内在特征,并使后续任务在这个低维表示上的工作量更低,同时泛化性能和识别率更高。通过利用非负矩阵分解独特的优势,不仅可以进行降维,而且物理意义明确。
因此,需要对这些庞大的原始矩阵进行分解,达到数据压缩、降维、降噪的目的。但也有可能破坏数据样本之间的本质结构,影响聚类效果。此外,传统的聚类算法认为,只需要将这些不同属性下的样本组合成一个整体进行处理,因为多角度的样本是同一对象不同属性的组合形式。但是,这种方法可能会破坏原始对象在不同属性下的独立性,导致得到的全局聚类结果并不理想。
发明内容
本发明的目的在于提出一种基于非负矩阵因子分解和分割自适应融合的多视图模糊聚类算法,该算法具有较好的自适应性和聚类效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学,未经中国人民解放军陆军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911332635.0/2.html,转载请声明来源钻瓜专利网。