[发明专利]文本语义识别方法、装置、计算机设备及存储介质有效
申请号: | 202110218904.1 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112949317B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 沈越 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F40/117;G06K9/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 语义 识别 方法 装置 计算机 设备 存储 介质 | ||
1.一种文本语义识别方法,其特征在于,包括下述步骤:
输入检测文本至预设基础模型,经过所述预设基础模型的编码层输出得到所述检测文本的第一句向量;
输入所述第一句向量至所述预设基础模型的准入门,根据所述准入门输出得到所述检测文本的第二句向量,具体地,获取当前准入门的筛选阈值,将大于等于该筛选阈值的第一句向量确定为第二句向量;
获取所述检测文本的干扰特征向量,根据所述干扰特征向量对所述第二句向量进行筛选,得到第三句向量,其中,
所述获取所述检测文本的干扰特征向量的步骤具体包括:
获取预设的标准文本,根据预设匹配算法计算所述检测文本和所述标准文本的文本相似度;
在所述文本相似度大于等于预设文本相似阈值时,确定所述检测文本和所述标准文本匹配成功,获取所述标准文本的标记文本向量,并将所述标记文本向量作为所述检测文本的干扰特征向量,其中,
所述获取所述标准文本的标记文本向量的步骤具体包括:
预先采集多个所述标准文本,根据所述预设基础模型对每个所述标准文本进行意图识别,得到预测识别结果;
获取所述标准文本的真实识别结果,根据所述预测识别结果和所述真实识别结果,确定所述标准文本的标记文本向量,其中,
所述根据所述预测识别结果和所述真实识别结果,确定所述标准文本的标记文本向量的步骤具体包括:
确定所述标准文本的预测识别结果和所述真实识别结果是否一致,在所述预测识别结果和所述真实识别结果不一致时,将所述预测识别结果和所述真实识别结果不一致的标准文本作为第一文本,并将所述预测识别结果作为所述第一文本的标记结果;
获取所述标准文本中预测识别结果和真实识别结果均为所述标记结果的第二文本,将所述第一文本的标记文本向量确定为所述第二文本的标记文本向量,其中,所述标记文本向量为所述标准文本的干扰特征向量,所述标记文本向量与所述标准文本被预先关联存储在数据库中,所述标准文本的干扰特征向量为预先获得的所述标准文本的干扰项;
获取所述第三句向量的匹配意图,并将所述第三句向量输入所述预设基础模型中的确定门中,根据所述确定门选取所述匹配意图中的命中意图,确定所述命中意图为所述检测文本的文本意图。
2.根据权利要求1所述的文本语义识别方法,其特征在于,所述输入检测文本至预设基础模型,经过所述预设基础模型的编码层输出得到所述检测文本的第一句向量的步骤具体包括:
输入所述检测文本至所述预设基础模型的编码层,基于所述编码层对所述检测文本进行位置编码、分类编码和嵌入编码,得到所述检测文本的第一句向量。
3.根据权利要求1所述的文本语义识别方法,其特征在于,所述获取所述第三句向量的匹配意图的步骤具体包括:
获取预设的标准向量,计算所述第三句向量和所述标准向量的第一余弦相似度,选取所述第一余弦相似度大于等于第一预设相似度的标准向量为匹配向量;
获取所述匹配向量的向量意图,确定所述向量意图为所述第三句向量的匹配意图。
4.根据权利要求1所述的文本语义识别方法,其特征在于,所述根据所述确定门选取所述匹配意图中的命中意图的步骤具体包括:
根据所述确定门计算所述第三句向量和所述检测文本的预设句向量的第二余弦相似度;
在所述第二余弦相似度大于等于第二预设相似度时,确定所述第三句向量与所述预设句向量匹配成功,并确定匹配成功的预设句向量对应的匹配意图为所述命中意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110218904.1/1.html,转载请声明来源钻瓜专利网。