[发明专利]基于非负矩阵分解和多样-一致性的多视图聚类方法在审
申请号: | 201810549602.0 | 申请日: | 2018-05-31 |
公开(公告)号: | CN108776812A | 公开(公告)日: | 2018-11-09 |
发明(设计)人: | 王秀美;张天真;高新波;张越美;郭丁宁;李洁;邓成;田春娜 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视图聚类 矩阵 视图数据 类标 非负矩阵 系数矩阵 归一化 基矩阵 分解 构建 生物信息分析 迭代更新 公共信息 交互信息 金融投资 均值聚类 目标函数 原始图像 聚类簇 聚类 多样性 应用 分析 学习 | ||
本发明提出了一种基于非负矩阵分解和多样‑一致性的多视图聚类方法,用于解决现有多视图聚类方法中存在的聚类精度和归一化交互信息较低的技术问题,实现步骤为:获取原始图像集的归一化非负多视图数据;构建多视图数据对应的基矩阵、系数矩阵和类标指示矩阵;构建基于非负矩阵分解和多样‑一致性多视图聚类的目标函数;获取基矩阵、系数矩阵和拉普拉斯矩阵的迭代更新表达式;获取类标指示矩阵的最优值;对类标指示矩阵的最优值进行K‑均值聚类,得到多视图数据对应的聚类簇。本发明利用表示多样性和类标一致性,学习多视图数据中的互补和公共信息,有效提高了多视图聚类的性能,可应用于生物信息分析和金融投资分析等领域。
技术领域
本发明属于计算机视觉和模式识别技术领域,涉及一种多视图聚类方法,具体涉及一种基于非负矩阵分解和多样-一致性的多视图聚类方法,可应用于生物信息分析、金融投资分析和商务应用等领域。
背景技术
近年来,互联网信息技术的发展,使得数据成为当今社会中重要的组成部分。随着多媒体技术的发展,数据呈现爆炸式增长,海量成为当今数据的一个显著特征。此外,随着信息采集技术的迅速发展,人们可以从不同数据源中获取大量数据,这些异质数据在不同角度描述同一目标的不同特征,将每个数据源的数据看作一个视图的数据,由此可得多视图数据。多视图数据中包含比单视图数据更加详细全面的信息,通常包含公共和互补信息。因此,多视图学习成为当今数据时代的一个研究方向。综上,如何从海量的多视图数据中提取出有用的信息成为现代数据处理的主要任务。数据挖掘是数据预处理中最常用的基本方法,聚类是数据挖掘领域中常用的基本分析方法之一。如今,针对单视图数据的传统聚类方法已取得较好的效果,但若将传统聚类方法直接应用到多视图数据中进行聚类,不能有效利用多视图数据中的公共和互补信息,因而影响了多视图数据的聚类效果。因此,如何利用多视图数据中包含的丰富信息提高聚类性能,成为现阶段聚类领域中的关键问题,如何设计快速有效的多视图聚类方法,成为大数据时代亟待解决的问题。
聚类是机器学习和数据挖掘领域的基本方法,其目的在于利用数据中的潜在数据结构,将数据集划分为若干个聚类簇,使得同一簇中的数据点之间的相似性较高,不同簇间的数据点间的相似性较低。传统的单视图聚类方法可分为基于原型、基于层次、基于密度、基于网格、基于图和基于模型等聚类方法。多视图聚类方法的关键在于如何融合多视图数据,充分利用多视图数据中的有用信息提高多视图数据的聚类性能。一种朴素的多视图聚类方法是将多视图数据进行拼接得到一个新的单视图数据,再通过传统的单视图聚类方法得到聚类结果。此类方法只是原则上组合了不同视图的数据,忽略了不同视图数据中包含的公共和互补信息,从而影响了多视图数据的聚类效果。另一种多视图聚类方法是学习多视图数据的一个公共子空间,并在此公共子空间中进行多视图数据的聚类分析,由此得到多视图数据的聚类结果。这类算法通常可以学习到多视图数据中的公共信息,因此可以得到较好的聚类结果。
非负矩阵分解(Nonnegative Matrix Factorization,NMF)将数据矩阵分解为两个低秩矩阵的乘积,实现了数据的降维,一般情况下,分解后的基矩阵和系数矩阵是非负且稀疏的,该方法具有较好的可解释性和明确的物理意义,因此,非负矩阵分解成为数据表示中有力的基本方法,被广泛应用于单视图数据聚类和多视图数据聚类领域中。现有基于非负矩阵分解的多视图聚类方法虽然取得了较好的聚类结果,但是此类方法在对多视图数据进行聚类时,忽略了多视图数据中包含的互补信息,使得聚类精度和归一化交互信息较低,影响了多视图数据的聚类效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810549602.0/2.html,转载请声明来源钻瓜专利网。