[发明专利]基于图结构学习的缺失多视图子空间聚类方法及系统在审
申请号: | 202210027703.8 | 申请日: | 2022-01-11 |
公开(公告)号: | CN114529745A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 梁成;王道远;商明超 | 申请(专利权)人: | 山东师范大学 |
主分类号: | G06V10/762 | 分类号: | G06V10/762;G06V10/74;G06V10/774;G06K9/62 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 杨琪 |
地址: | 250014 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 结构 学习 缺失 视图 空间 方法 系统 | ||
本发明提供了一种基于图结构学习的缺失多视图子空间聚类方法及系统,包括:获取训练缺失多视图的特征数据集;依据特征数据集,基于多视图谱聚类和低秩表示学习得到每个视图数据的潜在表示和伪标签矩阵,通过多视图子空间聚类学习得到统一的相似性矩阵,构造基于图结构学习的缺失多视图子空间聚类目标函数;求解基于图结构学习的缺失多视图子空间聚类目标函数,得到相似性矩阵;获待聚类缺失多视图的特征数据集,在所述相似性矩阵的基础上施加秩约束,得到块对角矩阵,得到聚类结果本发明将潜在表示学习、谱嵌入和图聚类整合到一个统一的学习框架中,联合低秩表示和多视图子空间聚类学习得到最优图结构的聚类结果。
技术领域
本发明属于子空间聚类技术领域,尤其涉及一种基于图结构学习的缺失多视图子空间聚类方法及系统。
背景技术
现实世界中的事物总是可以从不同的方面来探索,就像来自不同渠道或以多种模式发现的各种数据一样,例如,在精准的医学中,一个人的分子特征可以由多个组学数据集描述,如基因组学、蛋白质组学和转录组学数据等。每种组学数据可以在不同的层次上描述病人,因此可以被认为是同一个人的不同分子观点,这种数据称为多视图数据,其中一类特征集被视为视图。由于多视图数据包含事物的一致性和多样性信息,可以帮助我们更全面地理解事物,因此,利用多视图数据的特性来提高集群任务的性能是非常重要的。
多视图聚类旨在利用多视图的特征将数据样本划分到不同的组中,使每个组中的样本具有比其他组更高的相似性,现有的缺失多视图聚类方法虽然在这方面取得了很大的进展,但仍然存在一些局限性。
发明人发现,现多视图聚类工作大多是以缺失视图中至少有配对样本的条件为前提,因此,那些处理传统多视图聚类的工作在面对没有配对样本和缺少视图的情况下是失败的;由于缺失视图中样本的缺失将导致传统多视图聚类方法的失败,从而影响聚类性能。
发明内容
本发明为了解决上述问题,提出了一种基于图结构学习的缺失多视图子空间聚类方法及系统,本发明将潜在表示学习、谱嵌入和图聚类整合到一个统一的学习框架中,联合低秩表示和多视图子空间聚类学习得到最优图结构的聚类结果。
为了实现上述目的,本发明是通过如下的技术方案来实现:
第一方面,本发明提供了一种基于图结构学习的缺失多视图子空间聚类方法,包括:
获取训练缺失多视图的特征数据集;
依据特征数据集,基于多视图谱聚类和低秩表示学习得到每个视图数据的潜在表示和伪标签矩阵,通过多视图子空间聚类学习得到统一的相似性矩阵,构造基于图结构学习的缺失多视图子空间聚类目标函数;
求解基于图结构学习的缺失多视图子空间聚类目标函数,得到相似性矩阵;
获得聚类缺失多视图的特征数据集,在所述相似性矩阵的基础上施加秩约束,得到块对角矩阵,得到聚类结果。
进一步的,所述特征数据集包括每个视图的样本数据集和伪标签矩阵。
进一步的,潜在表示和伪标签矩阵的目标函数为:
其中,λ表示第v个视图的误差矩阵的平衡参数,β表示平衡参数,F(v)∈Rn×c表示第v个视图的伪标签矩阵,n表示数据样本数,c表示聚类数,v表示视图序号,v=1,…,V,V表示视图总数,是第v个视图的拉普拉斯矩阵,G(v)表示未缺失样本的伪标签矩阵,表示每个视图的潜在表示,表示构造的潜在表示的误差矩阵,表示第v个试图的不缺失样本,(F(v))TF(v)=Ic表示F(v)为正交矩阵,表示对角线元素为0。
进一步的,相似性矩阵的目标函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东师范大学,未经山东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210027703.8/2.html,转载请声明来源钻瓜专利网。