[发明专利]文本语义识别方法及其模型的获取方法及相关装置有效
申请号: | 201911360687.9 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111144127B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 肖飞;宋时德;胡加学;赵乾 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G06F40/30 | 分类号: | G06F40/30;G06F40/289;G06F16/33 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 黎坚怡 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 语义 识别 方法 及其 模型 获取 相关 装置 | ||
1.一种文本语义识别方法,其特征在于,包括:
从多个文本规则中筛选与待识别文本匹配的文本规则,其中,所述多个文本规则是对标注有文本语义的多个样本文本进行分析而得到的;
基于匹配的所述文本规则和所述待识别文本,获取所述待识别文本的关键词序列;
将所述待识别文本和所述关键词序列输入经训练得到的文本语义识别模型进行语义理解,获取所述待识别文本的文本语义;
其中,所述文本语义识别模型是利用标注有文本语义的多个训练文本及其关键词序列训练预设神经网络得到的,所述关键词序列基于与所述训练文本匹配的文本规则和所述训练文本得到。
2.根据权利要求1所述的文本语义识别方法,其特征在于,所述文本语义识别模型包括顺序连接的输入层、长短期记忆网络层、自注意力机制层和输出层;
所述将所述待识别文本和所述关键词序列输入经训练得到的文本语义识别模型进行语义理解,获取所述待识别文本的文本语义之前,所述方法还包括:
分别对所述待识别文本和所述关键词序列进行分词及向量化,获得与所述待识别文本对应的第一词向量,以及与所述关键词序列对应的第二词向量;
所述将所述待识别文本和所述关键词序列输入经训练得到的文本语义识别模型进行语义理解,获取所述待识别文本的文本语义包括:
将所述第一词向量和所述第二词向量分别输入所述输入层,并经所述长短期记忆网络层、所述自注意力机制层进行编码处理,获得与所述待识别文本对应的第一特征向量,以及与所述关键词序列对应的第二特征向量;
通过所述输出层对所述第一特征向量和所述第二特征向量进行分类处理,以输出所述待识别文本的文本语义。
3.根据权利要求2所述的文本语义识别方法,其特征在于,
所述经所述长短期记忆网络层、所述自注意力机制层进行编码处理,获得与所述待识别文本对应的第一特征向量,以及与所述关键词序列对应的第二特征向量包括:
通过所述长短期记忆网络层对所述第一词向量和所述第二词向量分别进行第一编码处理,获得与所述待识别文本对应的第一隐层向量,以及与所述关键词序列对应的第二隐层向量;
通过所述自注意力机制层对所述第一隐层向量和所述第二隐层向量分别进行第二编码处理,获得与所述待识别文本对应的第一特征向量,以及与所述关键词序列对应的第二特征向量。
4.根据权利要求2所述的文本语义识别方法,其特征在于,所述待识别文本的关键词序列为多个,相应地,与所述关键词序列对应的第二特征向量为多个;
所述对所述第一特征向量和所述第二特征向量进行分类处理,以输出所述待识别文本的文本语义,包括:
将多个所述第二特征向量进行合并处理;
将经合并处理的第二特征向量与所述第一特征向量进行拼接,获得所述待识别文本的编码特征向量;
对所述编码特征向量进行预测处理,输出所述待识别文本的文本语义。
5.根据权利要求4所述的文本语义识别方法,其特征在于,所述将多个所述第二特征向量进行合并处理包括:
分别将所述文本语义识别模型所要预测的每个文本语义作为目标文本语义,并对每个所述目标文本语义执行以下步骤:
将所述多个关键词序列中与所述目标文本语义相关的关键词序列作为第一正向关键词序列,并将其他关键词序列作为第一负向关键词序列;
分别获取所述第一正向关键词序列对应的第二特征向量间的第一向量和,以及所述第一负向关键词序列对应的第二特征向量间的第二向量和;
获取所述第一向量和与第二向量和之间的向量差;
所述将经合并处理的第二特征向量与所述第一特征向量进行拼接,获得所述待识别文本的编码特征向量,包括:
分别将每个所述目标文本语义对应的向量差与所述第一特征向量进行拼接,得到每个所述目标文本语义对应的编码特征向量;
所述对所述编码特征向量进行预测处理,输出所述待识别文本的文本语义包括:
分别利用每个所述目标文本语义对应的编码特征向量,获得所述待识别文本属于每个所述目标文本语义的概率值;
将最高的概率值所对应的目标文本语义确定为所述待识别文本的文本语义。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911360687.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种碳纳米管场发射阴极的小型离子源
- 下一篇:一种任意脉冲分频输出方法