[发明专利]文本语义识别方法、装置、计算机设备及存储介质有效
申请号: | 202110218904.1 | 申请日: | 2021-02-26 |
公开(公告)号: | CN112949317B | 公开(公告)日: | 2022-10-11 |
发明(设计)人: | 沈越 | 申请(专利权)人: | 平安普惠企业管理有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/211;G06F40/117;G06K9/62 |
代理公司: | 深圳市世联合知识产权代理有限公司 44385 | 代理人: | 汪琳琳 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 语义 识别 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例属于人工智能领域,涉及一种文本语义识别方法,包括输入检测文本至预设基础模型,经过预设基础模型的编码层输出得到检测文本的第一句向量;输入第一句向量至预设基础模型的准入门,根据准入门输出得到检测文本的第二句向量;获取检测文本的干扰特征向量,根据干扰特征向量对第二句向量进行筛选,得到第三句向量;获取第三句向量的匹配意图,并将第三句向量输入预设基础模型中的确定门中,根据确定门选取匹配意图中的命中意图,确定命中意图为检测文本的文本意图。本申请还提供一种文本语义识别装置、计算机设备及存储介质。此外,本申请还涉及区块链技术,所述文本意图可存储于区块链中。本申请提高了文本语义识别的准确率。
技术领域
本申请涉及人工智能技术领域,尤其涉及文本语义识别方法、装置、计算机设备及存储介质。
背景技术
当前,现有的语义智能识别模型通常采用大量人工标注数据,然后通过标注数据训练得到。该语义识别模型的数据标注耗时较长,人工时间成本高,时效性差。传统的模型较往往不能实现定制化开发和修改,内部的参数一旦训练完成则不可改变。当生产中发现语义识别模型准确率较低,需要对模型进行及时修改时,则无法提前根据备选的选方案对模型进行调整。对语义识别模型的修复往往也只能通过在其外层添加正则进行修复,但无法确认正则逻辑和模型是否有冲突,难以保证正则的逻辑性,覆盖性和准确性。最终导致,语义识别模型在对语义进行识别时准确率低下的问题。
发明内容
本申请实施例的目的在于提出一种文本语义识别方法、装置、计算机设备及存储介质,以解决文本语义识别准确率低下的技术问题。
为了解决上述技术问题,本申请实施例提供一种文本语义识别方法,采用了如下所述的技术方案:
输入检测文本至预设基础模型,经过所述预设基础模型的编码层输出得到所述检测文本的第一句向量;
输入所述第一句向量至所述预设基础模型的准入门,根据所述准入门输出得到所述检测文本的第二句向量;
获取所述检测文本的干扰特征向量,根据所述干扰特征向量对所述第二句向量进行筛选,得到第三句向量;
获取所述第三句向量的匹配意图,并将所述第三句向量输入所述预设基础模型中的确定门中,根据所述确定门选取所述匹配意图中的命中意图,确定所述命中意图为所述检测文本的文本意图。
进一步的,所述输入检测文本至预设基础模型,经过所述预设基础模型的编码层输出得到所述检测文本的第一句向量的步骤具体包括:
输入所述检测文本至所述预设基础模型的编码层,基于所述编码层对所述检测文本进行位置编码、分类编码和嵌入编码,得到所述检测文本的第一句向量。
进一步的,所述获取所述检测文本的干扰特征向量的步骤具体包括:
获取预设的标准文本,根据预设匹配算法计算所述检测文本和所述标准文本的文本相似度;
在所述文本相似度大于等于预设文本相似阈值时,确定所述检测文本和所述标准文本匹配成功,获取所述标准文本的标记文本向量,并将所述标记文本向量作为所述检测文本的干扰特征向量。
进一步的,所述获取所述标准文本的标记文本向量的步骤具体包括:
预先采集多个所述标准文本,根据所述预设基础模型对每个所述标准文本进行意图识别,得到预测识别结果;
获取所述标准文本的真实识别结果,根据所述预测识别结果和所述真实识别结果,确定所述标准文本的标记文本向量。
进一步的,所述根据所述预测识别结果和所述真实识别结果,确定所述标准文本的标记文本向量的步骤具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安普惠企业管理有限公司,未经平安普惠企业管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110218904.1/2.html,转载请声明来源钻瓜专利网。