[发明专利]基于成对协同正则化和NMF的自适应多视图聚类方法有效
申请号: | 201710466702.2 | 申请日: | 2017-06-20 |
公开(公告)号: | CN107292341B | 公开(公告)日: | 2019-12-10 |
发明(设计)人: | 王秀美;张天真;高新波;王鑫鑫;李洁;邓成;田春娜 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 61205 陕西电子工业专利中心 | 代理人: | 韦全生;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 成对 协同 正则 nmf 自适应 视图 方法 | ||
本发明提出了一种基于成对协同正则化和NMF的自适应多视图聚类方法,用于解决现有多视图聚类方法中存在的精度低和归一化交互信息低的技术问题,实现步骤为:获取原始图像集的归一化非负多视图数据;计算多视图数据的拉普拉斯矩阵;构建成对协同正则化和NMF的自适应多视图聚类的目标函数;分别获取基矩阵、系数矩阵和权重参数的迭代更新表达式;获取更新后的基矩阵、系数矩阵和权重参数;对更新后的系数矩阵进行K‑均值聚类,得到聚类结果。本发明利用成对协同正则化方法保持视图间的相似性,并利用自适应方法自动学习视图内的相似性约束项的权重参数,有效提高了多视图聚类的性能,可应用于客户信息分析、金融分析和医学等领域。
技术领域
本发明属于计算机视觉和模式识别技术领域,涉及一种自适应多视图聚类方法,具体涉及一种基于成对协同正则化和NMF的自适应多视图聚类方法,可应用于客户信息分析、金融分析和医学等领域。
背景技术
随着互联网、信息采集和信息检索等技术的高速发展,数据量急剧增多,信息社会已进入大数据时代。因此,如何从海量的数据中提取能够为我们所用的信息成为现代科学的当务之急。由此,数据挖掘应运而生,成为一种数据信息处理技术。聚类是数据挖掘领域中进行数据处理的重要分析工具和方法,同时也是机器学习领域中重要的研究方向。如今,单视图的数据聚类已取得较好的效果,然而,现阶段实际应用中的数据一般通过多特征或多视图进行描述,并且每个特征往往包含互补和交互信息。因此,如何利用多特征或多视图所包含的信息提高聚类性能,成为现阶段聚类的关键问题。针对多视图数据,如何设计快速有效的聚类算法,成为大数据时代亟待解决的问题。
聚类是将物理或抽象对象的集合分成由类似的对象组成的多个簇的过程。聚类算法以相似性为基础,由聚类所生成的簇是一组数据对象的集合,同一簇中的对象彼此相似,不同簇间的对象相异。聚类算法是为单视图数据设计的方法,经典的单视图聚类算法可分为基于划分、基于层次、基于密度、基于网格和基于统计学等聚类算法。多视图聚类的关键是如何融合多视图数据。多视图聚类一种朴素的做法是将不同视图的数据拼接成一个新的向量,然后基于拼接的向量,采用经典的单视图学习算法进行聚类。但这种方法只是原则上连接了不同视图的数据,而忽略了不同视图中的共享信息和特定的统计性质。另一种广泛使用的多视图聚类方法是对不同视图的数据进行融合,然后再进行聚类,得到聚类结果。这种方法可以充分挖掘不同视图的数据中包含的兼容和互补信息,因此可以得到较好的聚类结果。
NMF(Nonnegative Matrix Factorization,非负矩阵分解)将数据矩阵分解成两个低秩因子矩阵,实现了数据的低秩表示,并且分解后得到的基矩阵和系数矩阵具有较好的可解释性、明确的物理意义、占用存储空间少等优点,因此,NMF成为数据聚类的基本工具,广泛应用于单视图数据聚类和多视图数据聚类中。
例如Deng Cai,Xiaofei He和Jiawei Han等人,在2011年的IEEE TransactionsPattern Analysis and Machine Intelligence期刊的第8期,发表了名为“GraphRegularized Nonnegative Matrix Factorization for Data Representation”的文章,提出了基于图正则化NMF的数据表示方法,将图正则化合并到NMF的算法框架中,利用NMF对数据进行分解,得到对应的基矩阵和系数矩阵,并对分解得到的系数矩阵进行图正则化约束,保持数据的局部几何结构信息,取得了较好的聚类效果。该方法是为单视图数据设计的,将该方法应用到多视图聚类时,对每个视图的数据进行NMF,并对每个视图得到的系数矩阵分别进行图正则化,保持每个视图的相似性,但这种推广只考虑了视图内的相似性,忽略了视图间的相似性,并且为图正则化约束项设置了相同的权重参数,因此,使得多视图聚类的精度低和归一化交互信息低,影响了聚类性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710466702.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于卷积神经网络的侧线鳞识别方法
- 下一篇:数据处理方法及相关产品