[发明专利]一种基于自适应权重的多视K多均值的图像聚类方法在审
申请号: | 202011044857.5 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112287974A | 公开(公告)日: | 2021-01-29 |
发明(设计)人: | 王博岳;宋作龙;田甜;张铁;刘易初;胡永利 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自适应 权重 均值 图像 方法 | ||
本发明涉及一种基于自适应权重的多视K多均值的图像聚类方法(Adaptive K‑Multiple‑Means for Multi‑view Clustering,AKM3C),用于解决多视图的图像聚类问题。不同于以往的多视K均值聚类方法仅使用一个簇中心去建模每个簇的数据分布,AKM3C使用多个子簇中心(也称为原型或均值)捕获每个视图中每个簇的数据分布。另外,AKM3C可以为每个视图自适应的分配权重,从而合理地融合不同视图的互补信息和兼容信息以构建一个共享的二部图,最后对共享的二部图施加拉普拉斯秩约束,将其划分为C个簇,实现图像样本的聚类,进而用于解决多视图的图像识别和检测问题。
技术领域
本发明涉及数据挖掘、机器学习和模式识别等领域,尤其是面向图像内容的多视图聚类任务。
背景技术
聚类是一种常用的数据分析方法,其目的是将无标签的数据按照一定的规则划分为若干个簇,使得每个簇内的数据相似,而不同簇之间的数据相异,即一个簇内部的任意两个样本具有较高的相似度,而属于不同簇的两个样本具有较高的相异度。在过去的几十年中,已经提出了许多经典的聚类方法(例如K-means聚类,谱聚类,核聚类等),并在图像处理、计算机视觉和文本挖掘等领域取得了巨大的成功。
在现实世界中,随着摄像机以及传感器等技术的广泛应用,数据通常由不同的领域、模态或特征组成,例如,图一包含了三种类型的多视图数据,图一(a)表明图像可以从不同的角度进行拍摄,每一个角度的图像是一个视图;图一(b)表明同一个事件可由不同的语言进行报道,每一种语言对应一个视图;图一(c)表明人脸图像在可见光(VIS)和近红外光(NIR) 下得到,即图像由不同的特征描述,每一种特征对应一个视图;所有这些都称之为多视图数据,是指对同一事物从不同角度或者按不同方式所得到的两个或两个以上的描述。
当前用于机器学习的主要方法是对单个视图表示的数据进行聚类,这种方法称为单视图聚类(或传统的聚类),因为它不考虑来自不同视图的相关信息,容易造成以偏概全的问题,不能够真实的反应数据的全貌。多视图聚类的目的是考虑不同视图的权重,通过融合各个视图的兼容和互补信息,全面的反映数据整体结构,使得聚类性能的效果得到提升。
随着大数据时代的到来,针对多视图数据的聚类引起了越来越多研究者的关注,它把无任何标注的多视图数据信息通过有效的处理将其划分成不同的簇。尤其是在计算机视觉和模式识别等领域,通过对不同视图的特征所构造的图像样本进行分析,将其融合成同一空间下的一致性表示,实现多视图的图像聚类,从而可进一步采用模式识别的方法对聚类好的图像进行识别,具有广泛的应用价值。
在多视聚类方法中,多视K均值聚类由于其效率和简易性而备受关注,这类方法主要是将大规模的多视图数据分解为多个聚类中心矩阵和一个公共的指标矩阵。但是其存在两处不足:1)多视K均值聚类仅使用一个中心对每个视图中的每个簇进行建模,无法准确地捕获不同视图中复杂的子簇数据分布。2)在大多数多视K均值聚类方法中,都需要引入一个额外的超参数对不同视图的权重进行分配,但是其超参数的设置在很大程度上都取决于人们的经验,所以其可用性不是很强。
发明内容
针对以上问题,提出了一种新的多视图聚类的方法,即基于自适应权重的多视K多均值聚类(Adaptive K-Multiple-Means for Multi-view Clustering,AKM3C),可用于解决多视图的图像聚类问题。不同于以往的多视K均值聚类方法仅使用一个簇中心去建模每个簇的数据分布,AKM3C使用多个子簇中心(也称为原型或均值)捕获每个视图中每个簇的数据分布。另外,AKM3C可以为每个视图自适应的分配权重,从而合理地融合不同视图的互补信息和兼容信息以构建一个共享的二部图,最后对共享的二部图施加拉普拉斯秩约束,将其划分为C个簇,实现图像样本的聚类,进而用于解决多视图的图像识别和检测问题。
技术方案
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011044857.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:相控阵天线串馈校准耦合网络校准方法
- 下一篇:生产戊基二羟基苯酸的方法