[发明专利]语句编码方法、语句解码方法、装置、存储介质及设备有效
申请号: | 201811444710.8 | 申请日: | 2018-11-29 |
公开(公告)号: | CN110263304B | 公开(公告)日: | 2023-01-10 |
发明(设计)人: | 孟凡东;张金超;周杰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/126 | 分类号: | G06F40/126;G06F40/151;G06F40/284;G06F40/58;G06F16/9032 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 张所明 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语句 编码 方法 解码 装置 存储 介质 设备 | ||
1.一种语句编码方法,其特征在于,用于编码模型中,所述编码模型包括级联的n个处理节点,所述处理节点包括级联的一个第一单元和至少一个第二单元,n≥2;所述方法包括:
对待编码的源语句进行分词运算,得到m个词汇,m≤n;
利用所述n个处理节点中的第i个处理节点获取所述m个词汇中的第i个词汇,并获取第i-1个处理节点得到的第i-1个词汇向量,所述第i-1个词汇向量是所述m个词汇中的第i-1个词汇的编码向量,i≤m;
利用所述第i个处理节点中的第一单元对所述第i个词汇和所述第i-1个词汇向量进行线性运算和非线性运算,将得到的第i个运算结果输出给所述至少一个第二单元进行处理,得到第i个词汇向量;
在得到m个词汇向量后,根据所述m个词汇向量生成语句向量,所述语句向量用于确定目标语句或目标分类。
2.根据权利要求1所述的方法,其特征在于,当所述编码模型是单向编码模型,且编码方向为从前往后时,
所述第i个处理节点是按照从前往后的顺序排列在所述n个处理节点中的第i个位置的处理节点;
所述第i个词汇是按照从前往后的顺序排列在所述m个词汇中的第i个位置的词汇。
3.根据权利要求1所述的方法,其特征在于,当所述编码模型是单向编码模型,且编码方向为从后往前时,
所述第i个处理节点是按照从后往前的顺序排列在所述n个处理节点中的第i个位置的处理节点;
所述第i个词汇是按照从后往前的顺序排列在所述m个词汇中的第i个位置的词汇。
4.根据权利要求1所述的方法,其特征在于,当所述编码模型是双向编码模型,且编码方向包括从前往后和从后往前时,m≤n/2;
所述第i个处理节点包括按照从前往后的顺序排列在所述n个处理节点中的第i个位置的处理节点,以及按照从后往前的顺序排列在所述n个处理节点中的第i个位置的处理节点;
所述第i个词汇包括按照从前往后的顺序排列在所述m个词汇中的第i个位置的词汇,以及按照从后往前的顺序排列在所述m个词汇中的第i个位置的词汇。
5.根据权利要求1至4任一所述的方法,其特征在于,所述利用所述第i个处理节点中的第一单元对所述第i个词汇和所述第i-1个词汇向量进行线性运算和非线性运算,包括:
利用所述第一单元将所述第i-1个词汇向量与第一差值进行元素积运算,得到第一乘积,所述第一差值等于预定数值减去所述第一单元的更新门控,所述更新门控用于衡量所述第i个词汇向量来自于所述第i个词汇和所述第i-1个词汇向量的比例;
利用所述第一单元通过线性变换函数对所述第i个词汇进行线性变换,将得到的线性变换函数值与线性变换门控进行元素积运算,得到第二乘积;通过双曲正切函数对所述第i个词汇和所述第i-1个词汇向量进行非线性变换,将得到的双曲正切函数值与第二乘积相加,得到候选激活函数值,所述线性变换门控用于控制所述候选激活函数值包含所述线性变换函数值;
利用所述第一单元将所述更新门控与所述候选激活函数值进行元素积运算,得到第三乘积;
利用所述第一单元将所述第一乘积与所述第三乘积相加,得到所述第i个运算结果。
6.一种语句解码方法,其特征在于,用于解码模型中,所述解码模型包括一个处理节点,所述处理节点包括级联的一个第一单元和至少一个第二单元;所述方法包括:
在第j个时刻,获取语句向量和第j个查询状态,所述语句向量是编码模型对待编码的源语句进行编码后得到的,所述第j个查询状态用于查询第j个时刻时所述源语句中编码的部分;
根据所述语句向量和所述第j个查询状态生成第j个源语言关注上下文,所述第j个源语言关注上下文是第j个时刻时所述源语句中编码的部分;
利用所述处理节点中的第一单元对所述第j个查询状态和所述第j个源语言关注上下文进行线性运算和非线性运算,将得到的第j个运算结果输出给所述处理节点中的至少一个第二单元进行处理,得到第j个词汇;
在得到k个词汇后,根据所述k个词汇生成目标语句,j≤k。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811444710.8/1.html,转载请声明来源钻瓜专利网。