[发明专利]训练分类器的方法和装置在审
申请号: | 202010109899.6 | 申请日: | 2020-02-23 |
公开(公告)号: | CN111382782A | 公开(公告)日: | 2020-07-07 |
发明(设计)人: | 王硕;岳俊;刘健庄;田奇 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 时林;王君 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 分类 方法 装置 | ||
本申请提供了一种训练分类器的方法,包括:获取第一训练样本,所述第一训练样本包括相应的语义标签;获取多个第二训练样本,每个所述第二训练样本包括相应的语义标签;根据所述第一训练样本和所述多个第二训练样本的语义相似度从所述多个第二训练样本中确定目标样本;根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器。基于语义相似度训练分类器能够提高分类器的训练效率和性能。此外,由于上述方法在特征提取时未使用语义标签进行学习,无需改变特征提取器的网络结构,从而能够提高神经网络的训练效率。
技术领域
本申请涉及人工智能领域,尤其涉及一种训练分类器的方法和装置。
背景技术
神经网络是实现人工智能的工具,神经网络在应用前需要经过大量样本的训练才能实现特定的功能,当需要神经网络实现新的功能时,通常还需要使用大量新样本训练神经网络。
一种减小再次训练神经网络的工作量的方法是知识迁移。神经网络基于大量样本完成训练后,学习到了知识;当使用新(novel)样本训练神经网络时,可以利用已经学习到的知识处理新样本,这样可以较少的新样本完成神经网络的再次训练,提升神经网络的性能。相比于新样本,上述大量样本可以称为基础(base)样本,
在利用知识迁移和新样本训练神经网络时,通常利用特征提取器从新样本中提取特征,并基于特征对新样本进行分类等处理,当新样本的类别改变时,特征提取器需要重新学习新类别的新样本的特征,导致训练工作量增大。
发明内容
本申请提供了一种训练分类器的方法和装置,能够分类器的训练效率和性能。
第一方面,提供了一种训练分类器的方法,包括:获取第一训练样本,所述第一训练样本包括相应的语义标签;获取多个第二训练样本,每个所述第二训练样本包括相应的语义标签;根据所述第一训练样本和所述多个第二训练样本的语义相似度从所述多个第二训练样本中确定目标样本;根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器。
语义相似度用于衡量知识迁移的难易程度,例如,花猫与虎皮猫的语义相似度较高,表示花猫图像和虎皮猫图像的特征相似度较高,分类器通过虎皮猫图像特征学习到的分类知识更容易迁移到花猫图像的分类过程中,可以使用更多虎皮猫图像训练分类器;花猫与猎犬的语义相似度较低,表示花猫图像与猎犬图像的特征相似度较低,分类器通过猎犬图像特征学习到的分类知识难以迁移到花猫图像的分类过程中,可以减少猎犬图像在分类器训练过程中的使用量。因此,基于语义相似度训练分类器能够提高分类器的训练效率和性能。此外,由于上述方法在特征提取时未使用语义标签进行学习,无需改变特征提取器的网络结构,从而能够提高神经网络(包含分类器)的训练效率。
可选地,所述根据所述第一训练样本、所述目标样本、所述第一训练样本和所述目标样本的语义相似度训练分类器,包括:通过所述分类器确定所述第一训练样本的预测得分;根据所述预测得分、所述第一训练样本与所述目标样本的语义相似度确定所述分类器的语义迁移损失函数Lsemantic,所述目标样本与所述第一训练样本的语义相似度用于确定所述预测得分对所述Lsemantic的影响程度;根据所述Lsemantic训练所述分类器。
根据语义相似度训练分类器能够提高分类器的性能。
可选地,当所述目标样本与所述第一训练样本的语义相似度大于等于语义迁移强度时,所述预测得分对所述Lsemantic的影响程度为100%;或者,当所述目标样本与所述第一训练样本的语义相似度小于语义迁移强度时,所述预测得分对所述Lsemantic的影响程度为0。
语义迁移强度可以根据经验设置,使得分类器学习到正确的分类知识,避免分类器被错误的分类知识误导。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010109899.6/2.html,转载请声明来源钻瓜专利网。