[发明专利]一种未知意图文本的识别方法及装置在审
申请号: | 202210307174.7 | 申请日: | 2022-03-25 |
公开(公告)号: | CN114756678A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 李健铨;刘小康;穆晶晶;胡加明 | 申请(专利权)人: | 鼎富智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 李少丹;许伟群 |
地址: | 230000 安徽省合肥市*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 未知 意图 文本 识别 方法 装置 | ||
1.一种未知意图文本的识别方法,其特征在于,包括:
获取每个训练样本对应的K个正样本和S个负样本,所述正样本是从所述训练样本的同类别样本中随机获取的,所述负样本是从所述训练样本的不同类别样本中随机获取的,K和S均为大于或者等于1的正整数;
使用分类器获取所述训练样本及其对应的所述正样本和所述负样本的句子表示,所述分类器通过对比学习损失函数使同类别样本的句子表示相互聚拢,通过分类学习损失函数使不同类别的句子表示相互远离;
根据所述句子表示确定每个类别的决策中心,并学习每个类别的决策边界;
获取待识别文本与各个类别的决策中心的相似度,以确定最大相似度对应的目标类别;
判断所述待识别文本是否位于所述目标类别的决策边界之外;
如果所述待识别文本位于所述目标类别的决策边界之外,确定所述待识别文本为未知意图文本;
如果所述待识别文本位于所述目标类别的决策边界之内,确定所述待分类文本属于所述目标类别。
2.根据权利要求1所述的方法,其特征在于,所述对比学习损失函数是根据所述训练样本与其任意所述正样本之间的距离,以及,所述训练样本与其所有所述负样本之间的距离之和构造的。
3.根据权利要求2所述的方法,其特征在于,所述对比学习损失函数具体为以下Loss1:
其中,N为正样本的数量,vi表示训练样本的句子表示的归一化结果,vj表示正样本的句子表示的归一化结果,v-表示负样本的句子表示的归一化结果,V+表示所有正样本的集合,V-表示所有负样本的集合,τ为超参数,exp(vi·vj/τ)表示所述训练样本与其任意所述正样本之间的距离,所述表示所述训练样本与其所有所述负样本之间的距离之和。
4.根据权利要求3所述的方法,其特征在于,所述分类学习损失函数是根据所述训练样本的句子表示与其类别对应的真实标签的表示之间的余弦距离,以及,所述训练样本的句子表示与所有其他类别标签的表示之间的余弦距离之和构造的。
5.根据权利要求4所述的方法,其特征在于,所述分类学习损失函数具体为以下Loss2:
其中,zi表示训练样本的句子表示,θyi表示训练样本的真实标签的表示,θj表示其他类别标签的表示,cos(θyi,zi)表示所述训练样本的句子表示与其类别对应的真实标签的表示之间的余弦距离,cos(θj,zi)表示所述训练样本的句子表示与其他类别标签的表示之间的余弦距离,m为一个预设的参数,s为一个预设倍数。
6.根据权利要求1所述的方法,其特征在于,所述学习每个类别的决策边界,包括:
根据所述训练样本的句子表示与其类别对应的决策中心之间的余弦距离与所述决策半径的数值关系构造决策边界优化函数,所述数值关系包括所述训练样本的句子表示与其类别对应的决策中心之间的余弦距离大于类别的决策边界,或者,所述训练样本的句子表示与其类别对应的决策中心之间的余弦距离小于或等于类别的决策边界;
根据所述决策边界优化函数学习每个所述类别簇的决策边界。
7.根据权利要求6所述的方法,其特征在于,所述决策边界优化函数具体为以下Lb:
其中,N为正样本的数量,Δyi表示类别的决策半径,cyi表示类别的决策中心,zi表示训练样本的句子表示,cos(cyi,zi)表示训练样本zi与决策中心cyi之间的余弦距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于鼎富智能科技有限公司,未经鼎富智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210307174.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于厨具手柄焊接专用设备
- 下一篇:一种具有防护抗冲击功能的矿井管道阀门