[发明专利]一种用于在线学习的样本分类方法及模型更新方法在审
申请号: | 201811578276.2 | 申请日: | 2018-12-21 |
公开(公告)号: | CN111353516A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 马俊凯 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 在线 学习 样本 分类 方法 模型 更新 | ||
本申请实施例公开了一种用于在线学习的样本分类方法,用于提高半监督学习的分类精确度。本申请方法包括:获取目标样本集合,所述目标样本集合包括多个训练样本和预测样本,其中,每个所述训练样本对应一个第一类别标签;根据所述第一类别标签确定所述多个训练样本的成对约束;确定满足所述成对约束的半正定矩阵;确定所述目标样本集合中每两个样本的马氏距离,其中所述马氏距离包括所述半正定矩阵;根据所述每两个样本的马氏距离通过基于图的半监督学习算法确定所述预测样本的第二类别标签,提高了半监督学习的分类精确度。
技术领域
本申请涉及数据处理领域,尤其涉及一种用于在线学习的样本分类方法及模型更新方法。
背景技术
在机器学习的训练阶段,有类别标签的样本非常稀缺,而没有类别标签的样本的获取则相对容易,且数量众多。由于半监督学习在训练阶段结合了没有类别标签的样本和少量有类别标签的样本,与全部使用类别标签的样本的监督学习相比,半监督学习可以在保证模型精度的同时,降低了训练成本。
在线学习算法可以通过获取正确的类别标签以及监督模型的预测标签,对监督模型进行在线更新,在线学习方法主要用于一些可以实时获得数据标注的系统中,而在没有用户反馈的系统中,在线学习则需要解决正确的类别标签如何获得的问题,在一种实现方式中,可以通过基于图的半监督学习模型获取正确的类别标签。
在传统的基于图的半监督学习中,通过构造一个权重图,将各个样本(包括有类别标签的样本和没有类别标签的样本)作为图中的节点,将样本之间的相似程度作为权重图中边的权重,并通过基于图的半监督学习算法将权重图中的标签信息从有类别标签的样本逐步传递到没有类别标签的样本,从而为没有类别标签的样本打上标签,实现了样本分类。
然而,现有技术中通常使用样本特征值之间的欧式距离作为样本之间的相似程度,由于样本特征值之间的欧式距离只能反映特征值之间的距离,但常常存在特征值之间的欧式距离较小而样本属于不同类别,或特征值之间的欧式距离较大而样本属于相同类别的情况,因此欧氏距离并不能准确的表示出样本之间的相似程度,从而降低了半监督学习的分类精确度,进而降低了在线学习的精确度。
发明内容
本申请实施例提供了一种用于在线学习的样本分类方法、模型更新方法及服务器,利用马氏距离来表示样本之间的相似程度,并利用成对约束来约束马氏距离中的半正定矩阵,由于成对约束可以保证训练样本中类别标签相同的训练样本之间的距离较小,且训练样本中类别标签不同的训练样本之间的距离较大,因此由满足成对约束的半正定矩阵构成的马氏距离可以准确的表示出样本之间的相似程度,提高了半监督学习的分类精确度。
本申请实施例第一方面提供了一种用于在线学习的样本分类方法,包括:获取目标样本集合,所述目标样本集合包括多个训练样本和预测样本,其中,每个所述训练样本对应一个第一类别标签;根据所述第一类别标签确定所述多个训练样本的成对约束;确定满足所述成对约束的半正定矩阵;确定所述目标样本集合中每两个样本的马氏距离,其中所述马氏距离包括所述半正定矩阵;根据所述每两个样本的马氏距离通过基于图的半监督学习算法确定所述预测样本的第二类别标签。本申请实施例中,并不直接通过多个训练样本和预测样本直接确定各个样本之间的欧氏距离,而是根据所述第一类别标签确定所述多个训练样本的成对约束,该成对约束可以用来约束每两个样本的马氏距离中的半正定矩阵。由于成对约束可以保证训练样本中类别标签相同的训练样本之间的距离较小,且训练样本中类别标签不同的训练样本之间的距离较大,因此包括满足成对约束的半正定矩阵的马氏距离可以准确的表示出样本之间的相似程度。通过上述方式,利用马氏距离来表示样本之间的相似程度,并利用成对约束来约束马氏距离中的半正定矩阵,由于成对约束可以保证训练样本中类别标签相同的训练样本之间的距离较小,且训练样本中类别标签不同的训练样本之间的距离较大,因此由满足成对约束的半正定矩阵构成的马氏距离可以准确的表示出样本之间的相似程度,提高了半监督学习的分类精确度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811578276.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化工厂生产用冷却塔
- 下一篇:方舱用翻折转登爬梯