[发明专利]用于样本分类的神经网络模型的训练方法和装置在审
申请号: | 201910822201.2 | 申请日: | 2019-09-02 |
公开(公告)号: | CN110689048A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 马良庄 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 11309 北京亿腾知识产权代理事务所(普通合伙) | 代理人: | 孙欣欣;周良玉 |
地址: | 英属开曼群岛大开*** | 国省代码: | 开曼群岛;KY |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本说明书实施例提供一种用于样本分类的神经网络模型的训练方法和装置。方法包括:获取训练样本集中的训练样本,训练样本具有样本标识和样本类别标签;将训练样本输入特征提取模型,得到特征表示向量;将特征表示向量输入鉴别器模型,得到识别标识;根据识别标识和样本标识确定第一预测损失,以最小化第一预测损失为目标,对鉴别器模型和特征提取模型进行第一训练;将特征表示向量输入分类器模型,得到识别类别;根据识别类别和样本类别标签确定第二预测损失,并根据与第一预测损失负相关和与第二预测损失正相关确定第三预测损失,以最小化第三预测损失为目标,对分类器模型和特征提取模型进行第二训练。能够提高模型的泛化性。 | ||
搜索关键词: | 训练样本 预测 特征表示 向量 特征提取模型 鉴别器模型 样本标识 样本类别 最小化 神经网络模型 方法和装置 分类器模型 输入分类器 标签确定 输入特征 样本分类 泛化性 负相关 正相关 标签 | ||
【主权项】:
1.一种用于样本分类的神经网络模型的训练方法,所述方法包括:/n获取训练样本集中的训练样本,所述训练样本具有样本标识,以及预先标注的样本类别标签;/n将所述训练样本输入待训练的特征提取模型,通过所述特征提取模型输出所述训练样本的特征表示向量;/n将所述训练样本的特征表示向量输入待训练的鉴别器模型,通过所述鉴别器模型输出所述训练样本的识别标识;/n根据所述训练样本的识别标识和所述训练样本的样本标识确定第一预测损失,以最小化所述第一预测损失为目标,对所述鉴别器模型和所述特征提取模型进行第一训练;/n将所述训练样本的特征表示向量输入待训练的分类器模型,通过所述分类器模型输出所述训练样本的识别类别;/n根据所述训练样本的识别类别和所述训练样本的样本类别标签确定第二预测损失,并根据与所述第一预测损失负相关和与所述第二预测损失正相关确定第三预测损失,以最小化所述第三预测损失为目标,对所述分类器模型和所述特征提取模型进行第二训练。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910822201.2/,转载请声明来源钻瓜专利网。