[发明专利]一种用于在线学习的样本分类方法及模型更新方法在审
申请号: | 201811578276.2 | 申请日: | 2018-12-21 |
公开(公告)号: | CN111353516A | 公开(公告)日: | 2020-06-30 |
发明(设计)人: | 马俊凯 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 在线 学习 样本 分类 方法 模型 更新 | ||
1.一种用于在线学习的样本分类方法,其特征在于,包括:
获取目标样本集合,所述目标样本集合包括多个训练样本和预测样本,其中,每个所述训练样本对应一个第一类别标签;
根据所述第一类别标签确定所述多个训练样本的成对约束;
确定满足所述成对约束的半正定矩阵;
确定所述目标样本集合中每两个样本的马氏距离,其中所述马氏距离包括所述半正定矩阵;
根据所述每两个样本的马氏距离通过基于图的半监督学习算法确定所述预测样本的第二类别标签。
2.根据权利要求1所述的方法,其特征在于,所述成对约束包括:
最小化所述第一类别标签相同的所述训练样本之间的马氏距离平方和,且任意两个第一类别标签不同的所述训练样本的马氏距离大于或等于第一非负值。
3.根据权利要求1所述的方法,其特征在于,所述成对约束包括:
最小化所述第一类别标签相同的所述训练样本之间的马氏距离平方和,且最大化所述第一类别标签不同的所述训练样本之间的马氏距离平方和。
4.根据权利要求1所述的方法,其特征在于,所述成对约束包括:
最大化所述第一类别标签不同的所述训练样本之间的马氏距离平方和,且任意两个第一类别标签相同的所述训练样本的马氏距离小于或等于第二非负值。
5.根据权利要求1至4任一所述的方法,其特征在于,所述根据每两个样本的马氏距离通过基于图的半监督学习算法确定所述预测样本的第二类别标签,包括:
根据高斯核函数和所述马氏距离确定每两个所述样本的相似度;
根据所述相似度确定每两个所述样本之间的标签转移概率;
根据所述标签转移概率通过标签扩展算法确定所述预测样本的第二类别标签。
6.一种模型更新方法,其特征在于,包括:
获取目标样本集合,所述目标样本集合包括多个训练样本和预测样本,其中,每个所述训练样本对应一个第一类别标签;
根据监督学习模型确定所述预测样本的第三类别标签;
根据所述第一类别标签确定所述多个训练样本的成对约束;
确定满足所述成对约束的半正定矩阵;
确定所述目标样本集合中每两个样本的马氏距离,其中所述马氏距离包括所述半正定矩阵;
根据所述每两个样本的马氏距离通过基于图的半监督学习算法确定所述预测样本的第二类别标签;
根据所述第二类别标签和所述第三类别标签确定所述监督学习模型的损失值;
根据所述损失值通过在线学习算法更新所述监督学习模型。
7.根据权利要求6所述的方法,其特征在于,所述根据损失值通过在线学习算法更新所述监督学习模型,包括:
确定所述预测样本的样本数量;
若所述样本数量等于预设值,则根据所述损失值通过在线学习算法更新所述监督学习模型。
8.根据权利要求6或7所述的方法,其特征在于,所述监督学习模型为决策树模型、支持向量机模型或深度学习模型。
9.根据权利要求6至8中任一所述的方法,其特征在于,所述在线学习算法为随机梯度下降算法或小批量梯度下降算法。
10.一种服务器,其特征在于,包括:
收发模块,用于获取目标样本集合,所述目标样本集合包括多个训练样本和预测样本,其中,每个所述训练样本对应一个第一类别标签;
处理模块,用于根据所述第一类别标签确定所述多个训练样本的成对约束;
确定满足所述成对约束的半正定矩阵;
确定所述目标样本集合中每两个样本的马氏距离,其中所述马氏距离包括所述半正定矩阵;
根据所述每两个样本的马氏距离通过基于图的半监督学习算法确定所述预测样本的第二类别标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811578276.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种化工厂生产用冷却塔
- 下一篇:方舱用翻折转登爬梯