[发明专利]未知意图的识别方法、装置、设备及存储介质有效
申请号: | 202110297693.5 | 申请日: | 2021-03-19 |
公开(公告)号: | CN112966088B | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 包梦蛟 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/33;G06F16/35;G06N3/04;G06N3/08 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 谢冬寒 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 未知 意图 识别 方法 装置 设备 存储 介质 | ||
1.一种未知意图的识别方法,其特征在于,所述方法包括:
调用意图识别模型对待识别样本进行意图识别失败时,得到意图未知样本;
对所述意图未知样本的语义表征向量进行局部离群因子的异常检测,得到所述意图未知样本的局部离群因子密度,所述语义表征向量是针对所述意图未知样本在意图识别过程生成的中间向量;
响应于所述局部离群因子密度大于密度阈值,确定所述意图未知样本存在未知意图,所述意图未知样本用于通过人工标注新意图之后对所述意图识别模型进行再次训练。
2.根据权利要求1所述的方法,其特征在于,所述调用意图识别模型对待识别样本进行意图识别失败时,得到意图未知样本,包括:
调用所述意图识别模型对所述待识别样本进行特征学习,得到所述语义表征向量;
调用所述意图识别模型对所述语义表征向量与已知意图进行匹配,得到所述待识别样本的意图与所述已知意图的相似度;
响应于所述相似度小于相似度阈值,确定所述待识别样本为所述意图未知样本。
3.根据权利要求2所述的方法,其特征在于,所述意图识别模型包括全连接层和相似度预测函数;
所述调用所述意图识别模型对所述语义表征向量与已知意图进行匹配,得到所述待识别样本的意图与所述已知意图的相似度,包括:
将所述语义表征向量输入所述全连接层,得到特征映射后的特征向量;
通过所述相似度预测函数计算所述特征向量与所述已知意图之间的所述相似度。
4.根据权利要求2所述的方法,其特征在于,所述意图识别模型包括文本标注层、词嵌入层和双向编码器表示BERT模型;
所述调用所述意图识别模型对所述待识别样本进行特征学习,得到所述语义表征向量,包括:
将所述待识别样本输入所述文本标注层进行标注处理,得到标注后文本;
将所述标注后文本输入所述词嵌入层进行词嵌入,得到文本表征向量;
将所述文本表征向量输入所述BERT模型进行特征学习,得到所述语义表征向量。
5.根据权利要求1至4任一所述的方法,其特征在于,所述响应于所述局部离群因子密度大于密度阈值,确定所述意图未知样本存在未知意图之后,包括:
确定出存在未知意图的至少两个意图未知样本,所述至少两个意图未知样本对应至少两个语义表征向量;
基于所述至少两个语义表征向量对所述至少两个意图未知样本进行聚类计算,得到至少一类意图未知样本的样本集合。
6.根据权利要求1至4任一所述的方法,其特征在于,所述意图识别模型的训练过程包括:
获取训练样本,所述训练样本标注有已知意图;
调用神经网络模型对所述训练样本进行特征学习,得到样本语义表征向量;
调用所述神经网络模型计算所述样本语义表征向量与所述已知意图之间的损失,得到意图识别损失;
基于所述意图识别损失对所述神经网络模型进行反向传播训练,最终得到训练完成的所述意图识别模型。
7.根据权利要求6所述的方法,其特征在于,所述神经网络模型包括全连接层和相似度预测函数;
所述调用所述神经网络模型计算所述样本语义表征向量与所述已知意图之间的损失,得到意图识别损失,包括:
将所述样本语义表征向量输入所述全连接层,得到特征映射后的样本特征向量;
通过所述相似度预测函数计算所述样本特征向量与所述已知意图之间的相似度,基于所述相似度确定所述意图识别损失。
8.根据权利要求6所述的方法,其特征在于,所述神经网络模型包括文本标注层、词嵌入层和BERT模型;
所述调用神经网络模型对所述训练样本进行特征学习,得到样本语义表征向量,包括:
将所述训练样本输入所述文本标注层进行标注处理,得到标注后样本文本;
将所述标注后样本文本输入所述词嵌入层进行词嵌入,得到样本文本表征向量;
将所述样本文本表征向量输入所述BERT模型进行特征学习,得到所述样本语义表征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110297693.5/1.html,转载请声明来源钻瓜专利网。