[发明专利]一种基于张量奇异值分解的多视图谱聚类算法有效
申请号: | 201710262243.6 | 申请日: | 2017-04-20 |
公开(公告)号: | CN108734187B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 张燕;柯戈扬;潘炎;印鉴 | 申请(专利权)人: | 中山大学;广东恒电信息科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 奇异 分解 视图 谱聚类 算法 | ||
1.一种基于张量奇异值分解的多视图谱聚类算法,其特征在于,包括以下步骤:
S1:将每个视图通过高斯核表示得到各自的概率转移矩阵;
S2:用一个张量表示所有视图的概率转移矩阵,每个张量的前片表示一个视图的概率转移矩阵,利用数据分布规律建模求解,得到一个概率转移矩阵L,其中其中n表示样本总数,m表示视图总数;
S3:将概率转移矩阵L作为基于马尔可夫链的谱聚类算法的关键输入,计算得到谱聚类输出结果;
所述步骤S2的具体过程是:
S21:分析张量的数据分布规律,由于各个视图的数据在实际获取过程中都会受到噪声的干扰,必然包含了噪声,假设其中表示接近真实的概率转移矩阵组成的张量,ε表示噪声张量;
S22:张量的3个维度都体现了低秩性,主要表现以下两方面:
1)、如果一组对象可以聚成多个簇,那么属于同一个簇内的对象都是相似的,不同簇之间的对象差别比较大,由所有视图的概率转移矩阵组成的张量的各个前片表征了这一组对象之间的相似度,则的每个前片中属于同一簇内的行或列向量有相关性,进而行或列向量组的秩相对维度而言就会比较小,因此在横向和纵向上都是低秩的;
2)、从不同角度对同一组对象进行观测获取的数据描述即特征集合会有一定的差异,但它们都表征了这一组对象之间的内部关系,即它们所呈现的内部关系都是相似的,由所有视图的概率转移矩阵组成的张量的各个前片表征了这一组对象之间的相似度,正是体现对象内部关系的数据,因此的各个前片都是相似的,表现了竖向低秩性;
S23:张量每个前片是概率转移矩阵,则每个元素要必须大于等于零,并且前片的每行是一个概率分布,概率和为1,于是张量需要满足:
其中,e为元素值全为1的列向量;
S24:假设噪声的干扰是随机少量的,于是噪声张量ε是稀疏的,用L1-norm来表征;
S25:利用S21-S24的分析结果可建立模型,得到优化目标:
其中,λ是一个折中因子,ni表示张量ε各个维度的大小;
S26:对S25中优化目标求解后得到低秩张量的各个前片求和平均,得到概率转移矩阵L,即
步骤S25中得到的优化目标还需进行IALM优化求解,具体过程如下:
S251:对优化目标进行凸松弛处理,由于张量多重秩的凸包络是张量核范数得到:
S252:引入一个辅助变量将优化目标转化为:
S253:输入张量参数
S254:初始化以下变量:
S256:进行迭代过程,在每一次迭代中,更新变量并计算S252中优化目标的值,如果S252中优化目标的值小于阈值η,则停止迭代;
S257:输出变量ε的值,即为S25优化目标的解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广东恒电信息科技股份有限公司,未经中山大学;广东恒电信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710262243.6/1.html,转载请声明来源钻瓜专利网。