[发明专利]基于三元组的自动估计类数的子空间聚类方法在审
申请号: | 201810170826.0 | 申请日: | 2018-03-01 |
公开(公告)号: | CN108345910A | 公开(公告)日: | 2018-07-31 |
发明(设计)人: | 杨巨峰;程明明;梁杰;王恺 | 申请(专利权)人: | 南开大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 天津耀达律师事务所 12223 | 代理人: | 张耀 |
地址: | 300500 天津*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类 样本 三元组 高维数据 子空间 矩阵 计算机视觉 预处理步骤 二元关系 辅助措施 划分系统 模式识别 优化问题 传统的 数据集 低维 类簇 鲁棒 衡量 缓解 | ||
一种基于三元组的自动估计类数的子空间聚类方法,目的是高效且准确地对给定样本进行聚类,同时能够根据样本内部的相关关系,自动估计出要划分的类簇数量。另外,该系统可以找到高维数据样本内在的低维分布,从而缓解处理高维数据的难度。一个高效、自动且准确的聚类方法可以作为计算机视觉、模式识别等领域中很多任务的预处理步骤及辅助措施。本系统首先解决一个带约束的优化问题,以此得到数据集内样本之间的相关关系,构造出自表示矩阵;然后,不同于传统的基于二元关系的方法,本方法计算出更加鲁棒的样本间的三元组关系作为下一步衡量聚类划分的依据;最后,本方法基于三元组关系贪婪地寻找得到最优的聚类划分系统。
技术领域
本发明属于计算机视觉技术领域,涉及一种图像聚类算法,更具体地,涉及到一种面向给定图像数据集的自动估计类数并给出聚类结果的方法。
背景技术
现实场景中经常会遇到处理高维数据的任务,通常,如果直接进行处理,这些任务将面临计算量大、信息提取不完善等难点。传统的降维方法如主成分分析等假设数据均分布于一个环绕空间,继而将数据映射到一个低维的空间中。而高维往往分布在多个低维子空间的并,这些子空间的个数及各自的维数都是难以通过先验知识获得的。然而,准确地计算出这些子空间的相关信息,得到各个样本的子空间归属,继而根据样本相应的子空间情况进行降维分析、相关性分析等,都会极大地降低问题处理的难度。
子空间聚类问题在很长的一段时间都受到了很多研究者的关注。Elhamifar和Vidal于2009年提出了“稀疏子空间聚类”方法(E.Elhamifar and R.Vidal,SparseSubspace Clustering,Computer Vision and Pattern Recognition,2790-2797,2009),该方法通过L1范数来近似优化一个带有损失函数及惩罚项的目标函数,从而计算出样本内部的自表示关系作为对样本相似性的考量。经过证明,计算出的自表示矩阵呈现块对角结构,每个块对应一个独立的子空间。但是,这种方法假设类簇的数量是已知的,难以做到真正的无监督。后来,陆续又有研究者对原来的稀疏子空间聚类进行改进,提出了诸如基于低秩的、基于二范数、混合范数等的子空间聚类算法,使聚类性能得到一步步提升。
为了解决聚类过程中的类数自动估计问题,有研究者提出基于自表示矩阵的特征值对类数进行估计的方法,取得了不错的效果。但是这种方法极度依赖先验阈值的设置,很大程度上受不同应用场景的影响很大。因此,该领域面临的一个重要的问题便是寻找一种对超参数的设置不敏感的方法。
另外,传统的子空间聚类方法多基于样本对之间的二元的相似度(或距离),这些方法取得了不错的效果,但是在处理子空间交界处的样本的划分时会产生各种各样的问题,因此,更高维度的相关性信息需要被引入到模型中。
发明内容
本发明要解决的技术问题是:如何根据给定的数据样本内部的相关关系无监督地估计出数据集的子空间数量,并据此计算出各个样本的子空间归属。
为了解决上述技术问题,本发明提出了一种样本间的相关关系即“三元组”的概念。本方法首先优化一个自表示的目标函数计算出样本间的相似性。对于任意的三个样本,本方法根据计算出的二元相似性去判断其是否构成一个三元组。接下来,本方法采用一种贪婪的联合的优化方法,同时解决以下两个任务:(1)估计输入数据空间的子空间数量;(2)将样本划分到各个子空间。
本发明提供的自动估计类数的子空间聚类方法,包括以下步骤
1.对于输入的样本数据集,系统首先解决一个自表示的优化问题,得到包含样本对相关关系的系数矩阵;
2.系统根据各样本对之间的二元相关关系,计算出相对于传统二元关系更加鲁棒的样本间的三元组关系并给出理论证明,以此获得样本间更加丰富的相关性信息;同时可以更好地处理处于类簇边界处的样本的划分问题,使得聚类的准确率得以提升
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南开大学,未经南开大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810170826.0/2.html,转载请声明来源钻瓜专利网。