[发明专利]分类模型处理、意图识别方法、装置和计算机设备在审
申请号: | 202211000438.0 | 申请日: | 2022-08-19 |
公开(公告)号: | CN115456043A | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 刘庆斌;郝彦超;陈曦 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06F16/35 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 毛丹 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 处理 意图 识别 方法 装置 计算机 设备 | ||
1.一种分类模型处理方法,其特征在于,所述方法包括:
获取训练样本集合;所述训练样本集合包括属于已训练分类模型对应的已识别类别的训练样本以及属于新增类别的训练样本;
通过所述已训练分类模型,分别提取所述训练样本集合中各训练样本各自的第一样本特征;
通过待训练分类模型分别提取各所述训练样本各自的第二样本特征,并基于各所述第二样本特征进行分类,基于得到的各个第一分类结果确定分类损失;
基于同一训练样本的第一样本特征和第二样本特征进行损失计算,得到第一目标损失,基于属于不同类别的两两训练样本各自的第二样本特征进行损失计算,得到第二目标损失;
基于所述第一目标损失、所述第二目标损失以及所述分类损失调整所述待训练分类模型的参数并继续训练,当满足训练停止条件时,得到目标分类模型,所述目标分类模型用于识别所述已识别类别和所述新增类别。
2.根据权利要求1所述的方法,其特征在于,所述基于属于不同类别的两两训练样本各自的第二样本特征进行损失计算,得到第二目标损失,包括:
分别将每一个训练样本和所述训练样本集合中的各个训练样本组成训练样本对,得到多个训练样本对;
分别基于各个训练样本对各自对应的第二样本特征进行相似度计算,基于计算得到的相似度确定各个所述训练样本对各自对应的子损失;
统计目标训练样本对对应的子损失,得到第二目标损失,所述目标训练样本对为包含不同类别训练样本的训练样本对。
3.根据权利要求2所述的方法,其特征在于,所述基于计算得到的相似度确定各个所述训练样本对各自对应的子损失,包括:
针对每一个训练样本对应的相似度,将所述相似度减去预设相似度得到的目标差值;
在所述相似度小于所述预设相似度的情况下,将最小损失值确定为所述训练样本对应的子损失;
在所述相似度大于或者等于所述预设相似度的情况下,将所述目标差值确定为所述训练样本对应的子损失。
4.根据权利要求2所述的方法,其特征在于,所述统计目标训练样本对对应的子损失,得到第二目标损失,包括:
对于每一个训练样本对,获取所述训练样本对所包含的训练样本对应的类别标签,基于所述类别标签计算所述训练样本对对应的指示函数值;其中,所述指示函数值是通过指示函数计算得到的,在所述训练样本对所包含的训练样本对应的类别标签一致时,通过所述指示函数计算得到的指示函数值为第一数值,在所述训练样本对所包含的训练样本对应的类别标签一致时,通过所述指示函数计算得到的指示函数值为第二数值;
当计算得到的指示函数值为第一数值时,对所述训练样本对对应的子损失进行保留处理,得到所述训练样本对对应的目标子损失,当计算得到的指示函数值为第二数值时,对所述训练样本对对应的子损失进行屏蔽处理,得到所述训练样本对对应的目标子损失;
统计各个训练样本对各自对应的目标子损失,得到第二目标损失。
5.根据权利要求1至4任意一项所述的方法,其特征在于,在所述基于所述第一目标损失、所述第二目标损失以及所述分类损失调整所述待训练分类模型的参数并继续训练之前,所述方法还包括:
基于属于不同类别的两两训练样本对应的第一样本特征和第二样本特征进行损失计算,得到第三目标损失;
所述基于所述第一目标损失、所述第二目标损失以及所述分类损失调整所述待训练分类模型的参数并继续训练,包括:
统计所述第一目标损失、所述第二目标损失、所述第三目标损失以及所述分类损失,得到统计损失;
基于所述统计损失调整所述待训练分类模型的参数并继续训练。
6.根据权利要求1所述的方法,其特征在于,所述基于同一训练样本的第一样本特征和第二样本特征进行损失计算,得到第一目标损失,包括:
基于各个训练样本各自的第一样本特征和第二样本特征进行相似度计算,基于计算得到的相似度确定各个训练样本各自的子损失;所述训练样本的子损失和所述训练样本对应的相似度成负相关;
统计各个训练样本各自的子损失,得到第一目标损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211000438.0/1.html,转载请声明来源钻瓜专利网。