[发明专利]分类器训练方法及装置在审

申请号：	201610827322.2	申请日：	2016-09-14
公开（公告）号：	CN107818327A	公开（公告）日：	2018-03-20
发明（设计）人：	梁爽;杭文龙;王琼;秦璟;王平安	申请（专利权）人：	中国科学院深圳先进技术研究院
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	深圳中一专利商标事务所44237	代理人：	张全文
地址：	518000 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	分类训练方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明属于智能计算技术领域，尤其涉及一种分类器训练方法及装置。

背景技术

分类器训练是指利用少量标注样本和大量的未标注样本进行训练并未标注样本分类的问题。分类器训练是模式识别和学习领域研究的重要内容之一。正确利用大量的未标注样本信息辅助分类器的训练过程，对于提高分类器性能具有非常重大的实际意义。

目前利用大量的未标注样本来协助少量已标注样本训练分类器主要基于三种假设：平滑假设、聚类假设和流形假设。即分别假设已标注和未标注样本距离很近、位于同一个聚类内和位于低维流形中的一个局部邻域内，三种情况均具有相同的类标签。然而，在现实情况中的某些待分类数据并不一定满足上述假设，继续利用大量的未标注样本反而会干扰分类器的训练过程，造成分类器的性能下降。

目前，不基于上述假设情况，通过挖掘已标注和未标注数据间蕴含的共享隐特征，是一种更合理地利用未标注样本辅助分类器训练并提高分类性能的方法。该方法假设已标注数据和未标注数据在一个共享隐空间中分布一致，通过迭代方式求解已标注数据和未标注数据投影到该隐空间中的投影矩阵和分类器参数，以提高分类器的学习性能。但该方法利用已标注数据和未标注数据对应在原空间和隐空间的特征训练分类器，其通过迭代方式求解投影矩阵和分类器的参数，导致该类分类器训练方法计算量大、时间复杂度高。

发明内容

有鉴于此，本发明实施例提供了一种分类器训练方法及装置，以解决现有技术中分类器训练方法计算量大、时间复杂度高的问题。

本发明实施例的第一方面，提供了一种分类器训练方法，包括：

将样本对应在原始空间中的原特征以及在隐空间中的隐特征合并到特征增维空间中，所述样本包括已标注样本和未标注样本；

获取所述已标注样本在所述特征增维空间的增维特征，以及根据所述样本的原特征和隐特征得出所述特征增维空间的投影矩阵；

根据所述特征增维空间的投影矩阵，以及所述已标注样本的原特征和增维特征对分类器进行训练。

本发明实施例的第二方面，提供了一种分类器训练装置，包括：

特征空间转换模块，用于将样本对应在原始空间中的原特征以及在隐空间中的隐特征合并到特征增维空间中，所述样本包括已标注样本和未标注样本；

处理模块，用于获取所述已标注样本在所述特征增维空间的增维特征，以及根据所述样本的原特征和隐特征得出所述特征增维空间的投影矩阵；

分类器训练模块，用于根据所述特征增维空间的投影矩阵，以及所述已标注样本的原特征和增维特征对分类器进行训练。

本发明实施例相对于现有技术的有益效果：本发明实施例将样本对应在原始空间中的原特征以及在隐空间中的隐特征合并到特征增维空间中，并在特征增维空间中计算投影矩阵和已标注样本的增维特征，以及根据已标注样本的原特征和增维特征训练分类器，从而避免现有技术中基于隐空间的分类器训练方法通过迭代方式求解分类器的过程，能够大大减少计算量并降低时间复杂度。而且仅利用已标注数据的原特征和增维特训练分类器，能够提高分类器的训练速度和鲁棒性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本发明实施例提供的分类器训练方法的流程图；

图2是本发明实施例提供的分类器训练装置的框架图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

为了说明本发明所述的技术方案，下面通过具体实施例来进行说明。

实施例一：

图1示出了本发明实施例一提供的分类器训练方法的实现流程，用于对半监督学习中的分类器进行训练，详述如下：

在步骤S101中，将样本对应在原始空间中的原特征以及在隐空间中的隐特征合并到特征增维空间中，所述样本包括已标注样本和未标注样本。

本实施例中，特征增维空间中的数据可以包括原特征、隐特征和零向量。则所述已标注样本在所述特征增维空间中表示为：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。