[发明专利]一种基于不定核的多视图分类方法在审
申请号: | 201510188546.9 | 申请日: | 2015-04-20 |
公开(公告)号: | CN104809468A | 公开(公告)日: | 2015-07-29 |
发明(设计)人: | 薛晖 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210096 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 不定 视图 分类 方法 | ||
技术领域
本发明涉及模式识别与机器学习技术领域,特别涉及一种基于不定核的多视图分类方法。
背景技术
核方法是机器学习中的核心技术之一,是解决实际问题中存在的非线性学习问题的一类重要方法,其核心思想是通过一种非线性映射将原始数据嵌入到高维特征空间,然后利用线性学习器在新空间分析及处理数据。其优点主要体现在,无需提前知道非线性映射的具体形式与参数,而是引入核函数,通过改变核函数形式和参数,隐式地实现从低维输入空间到高维特征空间的映射;利用核函数,可将高维特征空间中复杂的内积运算转化为低维输入空间的核函数计算,从而巧妙地解决了在高维特征空间运算时可能出现的“维数灾难”等问题,大大降低了计算量;可根据具体问题,灵活地选择核函数,以嵌入更多学习问题的先验知识。
尽管核方法具有上述诸多的关键优点,但受限于传统的统计学习理论,现有的大部分核方法都要求核正定,满足Mercer条件。然而,在许多实际应用中,正定核有时并不能取得很好的泛化性能,甚至很难利用。相反地,不定核恰能表现出比正定核更优的经验分类效果,正逐渐成为机器学习领域中的一个研究热点,受到越来越多研究者的关注。例如,在人脸识别问题中,Liu在核主成分分析(KPCA)中使用了不定的分数阶多项式核,取得了比使用正定的多项式核KPCA更好的识别效果;在视频跟踪问题中,Liwicki等进一步利用了不定的鲁棒梯度核,以解决在正定核KPCA中为了保持更新速度而使用简化的样本集表示所可能带来的不精确解问题。实验表明,采用不定核的KPCA明显优于使用正定的高斯核KPCA。但是,现有的不定核方法均局限于传统的单视图问题中。随着数据采集技术的不断发展,研究者发现在越来越多的真实世界问题中存在着大量多视图样本,譬如,人可以用人脸图像和声音描述,每个因特网网页可以用文档和网页链接表示等等。因此,将不定核方法进一步拓展到多视图学习问题中,以更好地适应实际应用的需要,是很有必要的。
多视图学习是机器学习的另一热点问题。大量研究表明,多视图数据中往往蕴藏着学习问题中更多的先验信息。多视图学习的目的就在于,深入挖掘多个视图间的潜在信息,通过视图间相互促进,以获得更好的学习性能。但是,在传统的多视图学习中,往往要求每个视图上数据的类标号完整,但在现实问题中这一要求常常很难满足。例如,在一段视频录像中,每秒钟都会闪过多帧图片,想要在每帧图片中标记出每个人几乎是不可能的;同时,如果录像中有多个人进行交谈,想要标记出每个人的音频也很难。因此,在视频和音频两个视图上的数据只有少量有标号的情况下,要保证每个视图上的数据均标记了所有的人更是难上加难。因此,多个视图上标号不完整是多视图学习中的难题之一,现有的多视图学习方法均不能或者很难有效地解决此问题。
在现有的多视图学习中,几乎所有的学习算法都是基于两个视图而设计的。当视图的个数多于两个时,可采用一对一的策略进行学习,即将视图两两组合,应用现有算法进行分类,然后投票决定最终的分类结果。因此,两个视图的多视图学习问题是解决多视图分类问题的关键。
发明内容
发明目的:针对现有技术存在的问题,本发明提出一种基于不定核的多视图分类方法,该方法通过将多个视图空间映射到一个新的统一的低维空间和引入不定核方法,有效避免了“维度灾难”,提高了后续分类的灵活性和有效性。
技术方案:在对该方法具体步骤进行描述之前,首先给出相关定义及表示:
(a)样本:一组亚马逊数据库图片数据集;
(b)类别标记:即一个样本的所属类别;
(c)不定核:由再生核Kreǐn空间中数据内积演化而来的不定核函数;
(d)典型相关分析算法(CCA):Canonical Correlation Analysis;
(e)主成分分析(PCA):Principal Component Analysis;
(f)半监督典型相关分析算法(SemiCCA):Semi-supervised Canonical Correlation Analysis;
(g)半配对半监督广义相关性分析(S2GCA):Semi-paired and Semi-supervised Generalized Correlation Analysis;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510188546.9/2.html,转载请声明来源钻瓜专利网。