[发明专利]一种意图识别方法、装置、电子设备及存储介质有效
申请号: | 202011062489.7 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112232068B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 赵顺峰;练睿;肖杰;莫永卓 | 申请(专利权)人: | 和美(深圳)信息技术股份有限公司 |
主分类号: | G06F40/279 | 分类号: | G06F40/279;G06F16/35;G06F40/205 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 安娜 |
地址: | 518040 广东省深圳市福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 意图 识别 方法 装置 电子设备 存储 介质 | ||
本公开提供一种意图识别方法、装置、电子装置以及存储介质,包括以下步骤:获取待识别信息;对待识别信息进行识别,得到待识别信息分别对应于意图向量;其中,意图向量中包括多个表征值,每一表征值均至少对应一个预设意图;根据多个表征值判断待识别信息对应的意图;若多个表征值均小于或等于判定值,则待识别信息为无意图信息。一种意图识别方法、装置电子设备以及存储介质,在应用时,首先对待识别信息进行识别得到意图向量,意图向量中的每一表征值,均对应一个预设意图,且所有预设意图均可以为正向意图,如此,对待识别信息进行识别时,就针对预设意图的表征值进行分析计算即可,减小了运算的复杂度,提升了运算效率也提高了准确率。
背景技术
对话系统是常用的功能性系统,在系统的训练中加入无意图的负样本进行训练,训练后的系统能同时提升正负意图的识别率。
常见的方法中,在多意图类别识别问题中,除了业务关心的N(N1)个意图类别,常常还伴有无标签无意图的文本输入,以往的做法是把无意图类别作为“other”类,加入到标签体系中,成为N+1分类任务,在预测时再判断如果是“other”则为无意图输入。但是这样在进行意图向量的计算时,也需要对应计算“other”类对应的数值,这样就会加大意图向量计算的复杂度,也会影响运算效率,同时在标签体系的建立时也会加大难度。
发明内容
有鉴于此,本发明提供一种意图识别方法、装置、电子设备及存储介质,旨在提供一种在意图向量计算时,不需要计算“other”类的方法。
根据本申请的一方面,本申请提供一种意图识别方法,包括以下步骤:
获取待识别信息;
对所述待识别信息进行识别,得到所述待识别信息对应的意图向量;其中,所述意图向量中包括多个表征值,每一表征值均至少对应一个预设意图;
根据多个所述表征值判断所述待识别信息对应的意图;
其中,所述根据多个所述表征值判断所述待识别信息对应的意图,包括:
若多个所述表征值均小于或等于判定值,则所述待识别信息为无意图信息。
在本公开的一种示例性实施例中,所述判定值根据所述意图向量得到。
在本公开的一种示例性实施例中,所述根据多个所述表征值判断所述待识别信息对应的意图,还包括:
获取多个所述表征值中的最大值;
若所述最大值大于所述判定值,则所述最大值所对应的预设意图为所述待识别信息对应的意图。
在本公开的一种示例性实施例中,所述判定值根据下述公式得到:
B=1/N+a*std(y);
其中,B为所述判定值,N为所述预设意图的数量,a为超参数,std(y)为所述意图向量的标准差。
在本公开的一种示例性实施例中,所述方法还包括:
设置样本策略,所述样本策略中包括多个所述预设意图;
其中,所述样本策略至少规定了每一所述预设意图的标准向量,且所述意图向量的计算与所述标准向量相关。
在本公开的一种示例性实施例中,每一所述表征值为其对应的预设意图的概率向量。
根据本申请的一方面,本申请提供一种意图识别装置,包括:
获取模块,用于获取待识别信息;
识别模块,用于对所述待识别信息进行识别,得到所述待识别信息分别对应于意图向量;其中,所述意图向量中包括多个表征值,每一表征值均至少对应一个预设意图;
判断模块,用于根据多个所述表征值判断所述待识别信息对应的意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于和美(深圳)信息技术股份有限公司,未经和美(深圳)信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011062489.7/2.html,转载请声明来源钻瓜专利网。