[发明专利]基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质在审
申请号: | 201910446754.2 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110135520A | 公开(公告)日: | 2019-08-16 |
发明(设计)人: | 陈润泽;文杰;徐勇 | 申请(专利权)人: | 哈尔滨工业大学(深圳) |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市添源知识产权代理事务所(普通合伙) 44451 | 代理人: | 黎健任 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 视角 多视角 低维 存储介质 权重分配 归一化 自适应 构建 表征步骤 聚类类别 传统的 单视角 有效地 迭代 权重 样本 鉴别 捕捉 引入 全局 学习 | ||
本发明提供了一种基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质,该不完备多视角聚类方法包括:步骤1,多视角仿射图的构建及补全步骤:归一化各视角中的样本实例,构建并补全各视角的仿射图;步骤2,学习各视角间一致的低维表征步骤:迭代求取各视角间一致的低维表征;步骤3,聚类步骤:归一化全局低维表征并使用传统的单视角聚类方法(如k‑means)得到聚类类别。本发明的有益效果是:本发明通过相似图补全技术和视角权重鉴别因子的引入,有效地捕捉了数据的本质结构,提高了聚类性能。
技术领域
本发明涉及机器学习技术领域,尤其涉及基于图补全和自适应视角权重分配的不完备多视角聚类方法、装置、系统及存储介质。
背景技术
在机器学习领域,多视角聚类能够利用目标的多个视角特征将海量无标签数据自动地划分成若干类别,该技术已经广泛应用于图像聚类、医学诊断等场景。多种单视角聚类方法被扩展到多视角情形,例如多视角期望最大化算法(Multi-View ExpectationMaximum Clustering,MVEM)、多视角k-means方法(Multi-View K-Means Clustering,MVKM)、基于谱聚类的多视角聚类方法(Multi-View Spectral Clustering,MVSC)、基于非负矩阵分解的多视角聚类方法(Multi-View Nonnegative Matrix Factorization,MultiNMF)、基于典型相关分析的多视角数据低维映射(Multi-view CanonicalCorrelation Analysis,MCCA)等。其中,基于谱聚类和基于非负矩阵分解的多视角聚类方法的核心都是从不同视角中学习一致的子空间,然后在该子空间上实施传统的单视角聚类方法(如k-means)得到最终的聚类结果。由于每一个视角从不同的方面揭示了目标的特征,不同视角在含有一致的类别归属信息的同时,也包含了互为补充的鉴别有益信息,因此利用多个视角进行聚类性能可以超过单视角或者对多视角的简单拼接。
由于特征收集过程中的一些不可控因素,视角缺失情况时有发生。例如,将不同报社对同一新闻的报道看作该新闻的不同视角,由于不同报社报道的新闻覆盖面不完全相同,在对新闻主题进行聚类时,视角缺失是常见的情形。同样地,将不同设备或者不同光照下对物体采集的照片视作该物体的不同视角,由于部分设备损坏或者光照条件不达标,也可能出现视角缺失的情形。近年来,学者们越来越多地关注不完备多视角情形下的聚类方法。着眼于视角缺失的挑战,学者们提出了很多方法来降低缺失视角的负面影响。一些方法(Partial multi-View Clustering,PVC,Incomplete Multi-modality Grouping,IMG)利用完备样本(样本在各视角中的实例都存在)指导一致子空间的学习,由于这些方法要求完备样本的存在,其应用范围受到较大限制;一些方法(Multi-Incomplete-Viewclustering,MIC,Doubly Aligned Incomplete Multi-view Clustering,DAIMC)采用非负矩阵分解(Nonnegative Matrix Factorization,NMF)的框架,对视角中缺失样例的重构误差项赋予较低甚至为零的权重,这类方法往往不能捕获数据的本质结构,同时对噪声较为敏感。一些方法考虑了数据本质结构,如利用完备视角的仿射图对缺失视角的样例相似关系进行估计(Multiview Clustering with Incomplete Views,MCIC),但实际的多视角数据集中常常不存在完备的视角。一些方法为了克服这个问题,直接对所有的缺失样例的相似关系进行估计(Incomplete multi-View Clustering,IVC,Incomplete MultiviewSpectral Clustering with Adaptive Graph Learning,IMSC_AGL),然而不恰当的估计往往会在缺失率较大时造成大幅偏离真实结果的情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(深圳),未经哈尔滨工业大学(深圳)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910446754.2/2.html,转载请声明来源钻瓜专利网。