[发明专利]一种基于低秩约束自适应图学习的不完整多视图聚类方法在审
申请号: | 202211558793.X | 申请日: | 2022-12-06 |
公开(公告)号: | CN115795333A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 杜世强;张凯武;石玉清;刘宝锴 | 申请(专利权)人: | 西北民族大学 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/214 |
代理公司: | 青岛致嘉知识产权代理事务所(普通合伙) 37236 | 代理人: | 王巧丽 |
地址: | 730030 甘*** | 国省代码: | 甘肃;62 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 约束 自适应 学习 完整 视图 方法 | ||
本发明公开了一种基于低秩约束自适应图学习的不完整多视图聚类方法,包括:S1、针对每个视图的数据矩阵,在LRR模型中引入距离正则化项和基于低秩表示的非负约束来学习具有全局和局部数据结构的图;S2、基于谱聚类的多视图聚类算法得到每个视图的聚类指标矩阵,通过加权融合机制使用所述聚类指标矩阵来学习所有视图的一致性表示;S3、使用基于乘数交替方向法ADMM的高效迭代更新算法对所述一致性表示的目标函数进行优化,在一致表示上使用K‑means算法得到最终的聚类结果。本发明可实现更好的聚类效果、获得质量更好的图,明显优于现有方法。
技术领域
本发明属于数据分析技术领域,尤其涉及一种基于低秩约束自适应图学习的不完整多视图聚类方法。
背景技术
在信息爆炸的今天,数据量不断增加,在众多的数据中,如何提取出有用的信息成为人们关注的焦点。聚类是多元数据分析最重要和最基本的工具之一,已广泛应用于图像处理、推荐系统、生物信息学和其他研究领域。聚类按照某一个特定的标准(比如距离),把一个数据集分割成不同的类或簇,使得同一个簇内的数据对象的相似性尽可能大,同时不在同一个簇内的数据对象的差异性也尽可能的大,以便挖掘数据中固有的隐藏结构等信息。因此,可以根据相似度对数据进行划分,以获得更准确的聚类结果。如果从机器学习的角度来解释,聚类是一种无监督的学习方法,它可以对具有未知标签信息的数据执行聚类等操作,从而提取有用信息。
现有的聚类方法大部分是基于单视图数据提出的,但在大数据分析的实际应用中,数据来自不同的来源,这种数据称为多视图数据。仅从单个视图描述数据无法得到预期的效果,因此多视图数据聚类问题成为学者们研究的焦点。在过去的几十年中,人们研究了许多先进的多视图聚类算法。随着多视图聚类研究的不断发展,提出了越来越多的多视图聚类算法,其中,基于图的多视图聚类算法和基于子空间学习的多视图聚类算法因其优异的性能逐渐成为人们关注的焦点。基于图的方法的目的是在多视图数据之间学习一个一致的相似度矩阵,然后利用该相似度矩阵通过谱聚类算法获得最终聚类结果。基于图学习的方法取得了良好的进展,但研究人员发现,原始数据在原始空间中可能没有明显的聚类特征,但将其投影到另一个空间可能会有显著的效果,从而使得基于子空间学习的方法不断涌现。基于子空间学习的算法以多视图数据的不同视图为目标,目的是从多个子空间或潜在空间学习统一的表示,使聚类时更容易处理高维数据。
然而,在实际应用中,由于数据采集困难、成本高、数据量大,几乎不可能存在完整的多视图数据集。通常,多视图数据集中视图中某些实例对象的丢失通常被称为不完整的多视图数据。由于不完整数据中视图之间信息严重缺乏,视图之间的一致性和互补性不能像往常一样得到充分利用,这导致上述传统的多视图方法不再适用于不完整数据,在不完整数据中也不能得到满意的结果。因此,为了解决不完整数据的聚类问题,近年来提出了不完整多视图聚类。这些方法一般分为两类:基于矩阵分解的不完整多视图聚类和基于图的不完整多视图聚类。基于矩阵分解的不完全多视图聚类算法旨在利用矩阵分解技术直接获得所有视图的低维一致表示。与基于矩阵分解的方法相比,基于图的不完全多视图聚类方法能够更好地描述数据点之间的关系,更直观地探索数据的原始几何结构。
虽然有许多方法来处理不完整聚类问题,但仍有许多问题需要解决。例如,这些方法有以下局限性:现有算法专注于学习一致性表示,但不考虑局部数据结构,或充分利用数据局部结构,但无法学习全局一致性表示;填充方法会引入噪声。具体地说,去掉不好的部分不仅不能提高性能,而且会影响原始的完整数据;许多方法只能处理两个不完整的数据,不能处理不完整的多个视图数据。
发明内容
本发明的目的在于提供一种基于低秩约束自适应图学习的不完整多视图聚类方法,旨在解决上述背景技术中现有技术存在的问题。
本发明是这样实现的,一种基于低秩约束自适应图学习的不完整多视图聚类方法,该方法包括以下步骤:
S1、针对每个视图的数据矩阵,在LRR模型中引入距离正则化项和基于低秩表示的非负约束来学习具有全局和局部数据结构的图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北民族大学,未经西北民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211558793.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种燃气灶支架
- 下一篇:一种基于单片机的波特率转换装置