[发明专利]一种基于核正负标签传播的数据分类方法及系统在审
申请号: | 201711140253.9 | 申请日: | 2017-11-16 |
公开(公告)号: | CN108009570A | 公开(公告)日: | 2018-05-08 |
发明(设计)人: | 张召;贾磊;张莉;王邦军;李凡长 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 苏州创元专利商标事务所有限公司 32103 | 代理人: | 陶海锋 |
地址: | 215137 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 正负 标签 传播 数据 分类 方法 系统 | ||
本发明公开了一种基于核正负标签传播的数据分类方法,通过核函数将原始欧式空间的输入数据映射到更高维的核特征空间,并将负标签信息集成到传统的标签传播模型,提出一个统一的核正负标签传播模型,可用于自适应的数据分类。本发明方法将标签传播的领域范畴从原始欧式空间转换到核空间,并将标签传播过程与自适应权重学习过程集成并基于核空间进行。核正负标签传播模型为了实现数据线性不可分的问题,通过引入内积,将原始线性不可分的数据转换到高维的核空间,实现在高维核空间中线性可分的目的,增强分类能力。通过在核空间中同时最小化数据重构误差和标签分类误差,可获得自适应的权重系数,并可避免传统算法对近邻数的选择难问题。
技术领域
本发明涉及一种基于核正负标签传播的数据分类方法及系统,属于模式识别、数据挖掘和图像识别技术领域。
背景技术
标签传播作为最受欢迎的基于图形的半监督学习方法之一,是基于标记和未标记数据之间的内在关系将标记数据的标记信息传播到未标记数据的过程,主要是在邻域保持和标签适应度上折衷流形平滑度。由于其有效性和效率的特性,标签传播已经成为机器学习和计算机视觉领域的一个重要课题。更具体地,标签传播已经成功地应用于各种实际应用,例如,面部识别和图像分割。
一般来说,现有的基于图的标签传播方法可以根据它是否可以应用于分类新数据外,即分为直推式学习和归纳式学习两类。诱导式是直接预测未标记训练数据的未知标签,即它不能有效地处理新的测试数据,而归纳方法通过标签嵌入或重建有效地处理包含任务。特别是对于感应方法,基于代表性嵌入方案的电感算法包括灵活集成嵌入,嵌入式标签传播和拉普拉斯线性判别分析,它们可以通过明确学习投影分类器来解决样本外电感扩展,以处理外部新数据。应当注意,几乎所有现有的标签传播方法通过其计算每对实例之间的“欧式”距离来估计原始欧几里德空间中未标记数据的标签,在实际中这可能是不准确的,通过应用核函数映射的方法将数据映射到高维数据中进行分类。显然,由于非线性映射,那些原始的线性不可分的输入可以映射到内核空间中的可分离输入。第二,大多数现有方法先计算图权重,再通过k-最近邻搜索和权重分配进行标签传播,但无法避免近邻参数的选择难问题。此外,不能确保预先获得的权重对于后续标签预测和估计是最优的。
因此,为了克服现有标签传播模型的上述问题,提出一种对于线性不可分问题的解决方案能,以及避免参数选择的问题,实现快速提高图像分类的准确度,是本领域技术人员亟待解决的问题。
发明内容
本发明的发明目的是提供一种基于核正负标签传播的数据分类方法及系统。
为达到上述发明目的,本发明采用的技术方案是:一种基于核正负标签传播的数据分类方法,包括:
1)、输入原始的训练集数据,对输入的训练集数据随机划分为有标签训练集和无标签训练集,获得初始化类别标签矩阵;
2)、通过核函数将原始欧式空间的输入数据映射到更高维的核特征空间,将负标签信息传播与标签传播集成获得一个统一的联合框架,基于所述框架,在核空间中进行自适应权重学习和标签传播,实现数据重构误差和标签分类误差同时最小化;
3)、利用迭代的优化方法对所述框架求解最小化问题,获得软标签矩阵,基于所述软标签矩阵确定无标签训练样本的对应类别。
优选地,所述原始的训练集数据为图像数据向量集合
优选地,步骤(2)中,所述框架为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711140253.9/2.html,转载请声明来源钻瓜专利网。