[发明专利]分类模型的增量训练方法、装置和计算机设备在审
申请号: | 202211388547.4 | 申请日: | 2022-11-08 |
公开(公告)号: | CN115438755A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 刘孟洋 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 杨欢 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 增量 训练 方法 装置 计算机 设备 | ||
1.一种分类模型的增量训练方法,其特征在于,所述方法包括:
获取经真实样本和虚构样本共同训练得到的目标分类模型,所述目标分类模型支持对虚构类别和真实类别的预测;
获取新增样本,所述新增样本所属的新增类别不同于任一所述真实类别;
将所述新增样本输入至所述目标分类模型,并通过所述目标分类模型提取所述新增样本的特征向量;
确定特征空间中与各个虚构类别分别对应的目标代表特征,并基于所述特征向量与各目标代表特征间的差异,确定与所述新增样本匹配的目标虚构类别;
将所述目标虚构类别更新为所述新增类别,以使得所述目标分类模型支持对所述新增类别的预测。
2.根据权利要求1所述的方法,其特征在于,所述目标分类模型通过如下步骤训练得到:
获取真实样本和虚构样本,所述虚构样本是基于所述真实样本构建得到;
通过待训练的分类模型对所述真实样本进行预测,并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失,所述第一目标类别包括所述真实样本所属的目标真实类别、和与所述真实样本匹配的目标虚构类别;
通过所述待训练的分类模型对所述虚构样本进行预测,并基于预测得到的第二输出确定所述虚构样本对应于第二目标类别的第二损失,所述第二目标类别包括分别与所述虚构样本匹配的目标真实类别和目标虚构类别;
基于所述第一损失和第二损失,构建目标损失函数,通过所述目标损失函数对所述待训练的分类模型进行迭代训练,直至达到训练停止条件时停止,得到训练完成的目标分类模型。
3.根据权利要求2所述的方法,其特征在于,所述通过所述目标损失函数对所述待训练的分类模型进行迭代训练,包括:
通过所述目标损失函数对所述待训练的分类模型进行多次迭代训练,并在每次迭代训练后,确定当次迭代训练对应的梯度,并基于所述梯度的反向传播,对特征空间中每个类别各自对应的代表特征进行更新;其中,最后一次迭代训练完成后所得到的每个类别各自对应的代表特征,为各个类别的目标代表特征。
4.根据权利要求2所述的方法,其特征在于,所述通过待训练的分类模型对所述真实样本进行预测,并基于预测得到的第一输出确定所述真实样本对应于第一目标类别的第一损失,包括:
通过待训练的分类模型提取所述真实样本的特征向量,并基于所述真实样本的特征向量进行预测,得到所述真实样本对应于所有类别的第一概率;
基于所述第一概率、以及所述真实样本所属的目标真实类别,确定所述真实样本对应于所述目标真实类别的第一原始损失;
基于所述第一概率,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率;
基于所述第一假设概率,确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失;
基于所述第一原始损失和所述第一虚构损失,确定所述真实样本对应于第一目标类别的第一损失。
5.根据权利要求4所述的方法,其特征在于,所述基于所述第一概率,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率,包括:
基于所述真实样本所属的目标真实类别,确定与所述真实样本对应的二值化向量,所述二值化向量的维度与预设类别的数量相匹配;
对与所述真实样本对应的二值化向量进行逆运算,得到与所述真实样本对应的二值化逆向量;
基于所述第一概率和与所述真实样本对应的所述二值化逆向量,确定所述真实样本对应于除所述目标真实类别以外的其他类别的第一假设概率。
6.根据权利要求4所述的方法,其特征在于,所述基于所述第一假设概率,确定所述真实样本对应于所匹配的目标虚构类别的第一虚构损失,包括:
确定与所述真实样本匹配的目标虚构类别;
基于所述第一假设概率、以及所述目标虚构类别对应的虚构类别标签,确定所述真实样本对应于所述目标虚构类别的第一虚构损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211388547.4/1.html,转载请声明来源钻瓜专利网。