[发明专利]基于软块对角的多视聚类方法有效
申请号: | 201911152319.5 | 申请日: | 2019-11-20 |
公开(公告)号: | CN111046745B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 王博岳;罗萃萃;胡永利;魏运;孙艳丰;尹宝才 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06V40/16 | 分类号: | G06V40/16 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 吴荫芳 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对角 多视聚类 方法 | ||
本发明提出一种基于软块对角的多视聚类方法,涉及模式识别和机器学习等领域,尤其是面向人脸图像的不完整多视角数据的聚类任务。该方法在基于多视角数据自表示的模型上引入软块对角正则化,对学习到的多图进行融合,最终把得到的软块对角相似度矩阵执行NCut操作。相比于传统的硬块对角正则化,软块对角正则化对噪声和异常值更加鲁棒。完成了不完整多视聚类任务,提高了识别正确率。
技术领域
本发明涉及模式识别和机器学习等领域,尤其是面向人脸图像的不完整多视角数据的聚类任务。
背景技术
多视角数据聚类是当前数据挖掘领域的研究热点之一,在机器学习,模式识别和计算机视觉等方面都有着广泛的应用。相比于单视角图像视频数据,多视角数据可以看作对同一对象不同视角的采样,这种多视角采样提供了更全面的对象或场景的信息,有益于解决聚类应用中常用的光照和遮挡等问题。而如何获取多视视频数据的类别等语义信息,是多视视频大数据高效组织和有效利用的关键问题,这一问题的解决依赖于聚类分析中的无监督聚类方法的突破。
在聚类任务中,为了对具有K个类别的数据进行聚类,理想的相似矩阵应该具有精确的K个对角块,其中来自相同块的数据自然地被视为一个类别,这种块对角正则化策略通常被嵌入到谱聚类算法中以提高聚类性能,但仍存在若干缺点。一方面,它们被设计用于多个图的数据,而不是原始的多视角数据或特征。另一方面,这使得块对角矩阵具有恰好具有K个连通分量,其中K是类别的数量,忽略了噪声和异常值的重要性。
传统的多视聚类方法假设所有样本的各视信息都是完整的,但实际情况下某些视角数据有可能缺失,例如由于某视角拍摄设备故障或者线路传输故障造成某视角数据丢失,产生不完整多视数据,并且每个样本的缺失是视角的数量是随机的,这为多视聚类算法带来了困难。
发明内容
为解决传统方法聚类多视角数据出现的问题,本发明公开了一种基于软块对角策略的多视聚类方法,同时面向完整及不完整的多视角数据。该方法在基于多视角数据自表示的模型上引入软块对角正则化,对学习到的多图进行融合,最终把得到的软块对角相似度矩阵执行NCut操作。相比于传统的硬块对角正则化,软块对角正则化对噪声和异常值更加鲁棒。为了处理不完整的多视角数据,使用多个指示矩阵来标记每个视角中缺失样本的位置,从而完成不完整多视聚类任务。
基于软块对角正则化的多视聚类方法,适用于完整和不完整的多视角数据,包括以下步骤:
首先使用四个经典的人脸数据库(ORL,Yale,Extended YaleB和CMU-PIE)来构建输入样本点:a)将所有图片尺度归一化后提取LBP,Gist和Gabor特征作为完整多视数据样本的三个视角输入。b)对于完整的数据集,先随机从每个视角中删除0.1-0.4的样本再提取LBP,Gist和Gabor特征作为不完整多视数据样本的三个视角输入。
接下来利用提出的多视聚类方法MVC-SBD和IMVC-SBD分别对完整和不完整的多视输入数据进行处理:
·MVC-SBD:
s.t.diag(BM)=0,BM≥0,BM=BMT
·IMVC-SBD:
s.t.diag(BIM)=0,BIM≥0,BIM=BIMT
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911152319.5/2.html,转载请声明来源钻瓜专利网。