[发明专利]一种半配对多视图邻域相关分析方法在审
申请号: | 202110235176.5 | 申请日: | 2021-03-03 |
公开(公告)号: | CN112949718A | 公开(公告)日: | 2021-06-11 |
发明(设计)人: | 袁运浩;武照奇;李云;强继朋;朱毅;朱俊武 | 申请(专利权)人: | 扬州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 董旭东;陈栋智 |
地址: | 225000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 配对 视图 邻域 相关 分析 方法 | ||
本发明公开了一种半配对多视图邻域相关分析方法,包括1)利用
技术领域
本发明涉及模式识别领域,特别涉及一种半配对多视图邻域相关分析方法。
背景技术
典型相关分析(Canonical Correlation Analysis,CCA)是多视图学习中具有代表性的一种线性降维方法,其目标是寻找一对投影方向,使得两组随机变量在其上的投影具有最大的相关性。而多集典型相关分析(Multiset CCA,MCCA)则是CCA在多组变量情形下的一种拓展,其目标是寻找一组投影方向,使得多组变量在其上的投影具有最大的广义相关性。
局部保持投影(Locality Preserving Projection,LPP)方法是一种单视图线性降维方法,通过构建各样本间的邻域关系,实现对高维数据降维的同时保持空间中各样本的局部邻域结构,即在低维空间中最小化近邻样本间的距离加权平方和。
本质上,CCA和MCCA均是一种基于对齐数据的多视图学习方法,即给定的训练样本必须是成对的出现。但现实中的多视图数据,配对样本往往较少,而未配对样本大量存在,这种数据被称为半配对多视图数据。面对半配对情形,传统降维方法CCA和MCCA仅能利用少量的配对数据,并不能直接有效地处理未配对数据,最终导致所抽取出的特征判别力不强,从而使得模式分类效果不佳。
发明内容
本发明的目的是克服现有技术缺点,提供一种半配对多视图邻域相关分析(Multiview Neighborbood Correlation Analysis,MNeCA)方法,该方法不仅可以利用少量配对数据,而且还可以通过视图间样本的邻域关系充分利用大量未配对数据,从而缓解因配对样本过少而带来的过拟合现象。
本发明的目的是这样实现的:一种半配对多视图邻域相关分析方法,包括以下步骤:
一种半配对多视图邻域相关分析方法,其特征在于,包括以下步骤:
步骤1)给定半配对多视图训练数据其中p、u、n以及m分别表示配对样本数、未配对样本数、总样本数以及视图数,n=p+u,di表示第i个视图中训练样本的维数,利用k邻域和径向基函数计算视图内样本的相似度矩阵包括如下步骤:
步骤1-1)在第i个视图中,对于样本采用k邻域法找到其k个最近邻样本,并将k个最近邻样本形成的集合记为
步骤1-2)对于样本利用径向基函数计算其与中样本的相似度,如下:
其中||·||表示向量的2范数,利用公式(1)形成视图内样本的相似度矩阵
步骤2)利用视图间样本共享的配对样本和视图内样本的相似度矩阵,计算不同视图间样本的相似度矩阵Sij(i≠j),i,j=1,2,…,m,包括如下步骤:
步骤2-1)在第i个视图和第j个视图中随机选取N对配对样本,设定为其中N≤p;
步骤2-2)计算不同视图间样本和样本的相似度,如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于扬州大学,未经扬州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110235176.5/2.html,转载请声明来源钻瓜专利网。