[发明专利]一种基于核范数约束的多视图聚类方法及系统在审
申请号: | 202110780354.2 | 申请日: | 2021-07-09 |
公开(公告)号: | CN113505831A | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 曹江中;彭俏美 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 刘俊 |
地址: | 510090 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 范数 约束 视图 方法 系统 | ||
1.一种基于核范数约束的多视图聚类方法,其特征在于,包括以下步骤:
S1:对输入的多视图数据进行预处理;
S2:计算多视图数据样本之间的相似度,得到权重矩阵;
S3:将多视图数据中来自同一单视图的数据进行映射得到子空间,再对子空间采用核范数约束;
S4:将单视图投影到一个公共的受秩约束的低维子空间,得到目标函数;
S5:将目标函数从有约束问题转换为无约束问题,并对目标函数中的变量交替迭代优化至收敛,在优化后的低维子空间上运用谱聚类方法对多视图数据进行聚类,得到聚类结果。
2.根据权利要求1所述的多视图聚类方法,其特征在于,对输入的多视图原始数据进行预处理的步骤包括:
S11:特征提取:对同一批多视图数据采用多种特征提取方法得到不同的特征;
S12:数据清洗:对多视图数据中缺失部分采用样条插值法进行插值;对多视图数据中极大或极小的异常值采用取平均值法进行替换。
3.根据权利要求1所述的多视图聚类方法,其特征在于,所述S2步骤中,采用相似度度量函数计算多视图数据样本之间的相似度得到权重矩阵Wv,其表达公式如下:
式中,权重矩阵为由相似度组成的矩阵;表示第v个视图中第i个样本与第j个样本之间的相似度,表示第v个视图中第i个样本,表示第v个视图中第j个样本,表示与第v个视图中第i个样本最邻近的样本;k表示聚类簇数。
4.根据权利要求3所述的多视图聚类方法,其特征在于,所述S2步骤中,还包括以下步骤:根据所述权重矩阵对多视图数据执行流形正则化,其表达公式如下:
Lv=Dv-Wv
式中,Tr(·)表示矩阵的迹,Zv表示第v个视图的投影空间,Lv表示第v个视图的拉普拉斯矩阵,Dv为第v个视图的权重矩阵Wv对应的对角矩阵。
5.根据权利要求3所述的多视图聚类方法,其特征在于,所述S3步骤中,对子空间采用核范数约束,其中核范数约束的表达式如下:
s.t.X=XZ
式中,Z为多视图数据的投影空间,X为多视图数据的矩阵;||·||*表示核范数。
6.根据权利要求5所述的多视图聚类方法,其特征在于,所述S4步骤中,所述公共的低维子空间受拉普拉斯秩约束。
7.根据权利要求6所述的多视图聚类方法,其特征在于,将单视图投影到一个公共的受拉普拉斯秩约束的低维子空间得到的目标函数表达公式如下:
diag(Zv)=0
1Tai=1,0≤ai≤1,i=1,2,...,n
rank(LA)=n-c
LA=DA-WA
式中,Tr(·)表示矩阵的迹,Zv表示第v个视图的投影空间,Lv表示第v个视图的拉普拉斯矩阵;m为视图数,n为样本数;diag(·)表示矩阵的对角元素,rank(·)表示矩阵的秩;ai表示低维的公共子空间A中的第i列元素;表示L2范数;α、β、γ为对应的正则化参数;P是求解过程中引进的中间变量,P的大小为n行c列;LA表示关于低维的公共子空间A的拉普拉斯矩阵,WA为低维的公共子空间A的相似度矩阵,DA为相似度矩阵WA对应的对角矩阵。
8.根据权利要求7所述的多视图聚类方法,其特征在于,所述S6步骤中,采用拉格朗日乘子法将目标函数从有约束问题转换为无约束问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110780354.2/1.html,转载请声明来源钻瓜专利网。