[发明专利]一种信息处理方法、装置、计算机设备及存储介质有效
申请号: | 201910888623.X | 申请日: | 2019-09-19 |
公开(公告)号: | CN110781674B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 吴晓琳 | 申请(专利权)人: | 北京小米智能科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/284;G06F40/289;G06N3/0455;G06N3/08 |
代理公司: | 北京善任知识产权代理有限公司 11650 | 代理人: | 康艳青 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信息处理 方法 装置 计算机 设备 存储 介质 | ||
1.一种信息处理方法,其特征在于,包括:
利用机器翻译模型的编码器对待翻译词句进行编码,得到编码信息;
基于所述编码信息,获取并存储全局注意力参数;
利用所述机器翻译模型的解码器,在所述待翻译词句中每一个词语的所述编码信息的解码循环中,根据所述全局注意力参数确定所述解码器的全局注意力;
根据所述全局注意力获得对应所述解码循环中所要预测的词语的预测结果。
2.根据权利要求1所述的方法,其特征在于,所述全局注意力参数还包括至少以下之一:
基于所述待翻译词句中每一个词语的所述编码信息中的第一序列向量进行线性变换后得到的第二序列向量;
基于所述待翻译词句中每一个词语的所述编码信息中的第一内容向量进行线性变换后得到的第二内容向量。
3.根据权利要求1所述的方法,其特征在于,所述机器翻译模型包括N个编码器,所述N为编码器的总层数,所述N为大于或等于2的正整数;
所述利用机器翻译模型的编码器对待翻译词句进行编码,得到编码信息,包括:
利用所述机器翻译模型中第n层的所述编码器对第n-1层的所述编码器输出的第n-1层的第一编码信息进行编码,得到第n层的所述第二编码信息;
所述基于所述编码信息,获取并存储全局注意力参数,包括:
基于对应第n层的所述第二编码信息,获取并存储对应第n层的第一全局注意力参数以及第n层的层编号;其中,n为大于或等于2且小于或等于N的正整数。
4.根据权利要求3所述的方法,其特征在于,所述机器翻译模型包括N个解码器,所述N为解码器的总层数;
所述方法还包括:
根据当前所在解码器的第n层的层编号,读取与第n层编码器的层编号对应保存的第n层的所述第一全局注意力参数;
所述利用机器翻译模型的解码器,在所述待翻译词句中每一个词语的所述编码信息的解码循环中,根据所述全局注意力参数确定所述解码器的全局注意力,包括:
利用所述机器翻译模型中第n层所述解码器,在所述待翻译词句中每一个词语的第n层的第二编码信息的解码循环中,根据第n层的所述第一全局注意力参数确定所述第n层的所述解码器的第一全局注意力。
5.根据权利要求1所述的方法,其特征在于,所述方法还包括:
确定所述机器翻译模型的所述编码器和/或所述解码器中至少一层的归一化运算中的R个第一归一化算子;其中,所述R为大于或等于2的正整数;
将所述第一归一化算子等效转换成第二归一化算子,其中,所述第二归一化算子的运算次数少于所述第一归一化算子的运算次数;
利用所述S个所述第二归一化算子执行所述归一化运算;其中,所述S为小于R的正整数。
6.根据权利要求5所述的方法,其特征在于,所述将所述第一归一化算子等效转换成第二归一化算子,包括:
将R个所述第一归一化算子对应的第一变量转换成向量;
根据所述向量,确定S个所述第二归一化算子。
7.一种信息处理装置,其特征在于,包括:
得到模块,被配置为利用机器翻译模型的编码器对待翻译词句进行编码,得到编码信息;
获取模块,被配置为基于所述编码信息,获取并存储全局注意力参数;
确定模块,被配置为利用所述机器翻译模型的解码器,在所述待翻译词句中每一个词语的所述编码信息的解码循环中,根据所述全局注意力参数确定所述解码器的全局注意力;
获得模块,被配置为根据所述全局注意力获得对应所述解码循环中所要预测的词语的预测结果。
8.根据权利要求7的所述装置,其特征在于,所述全局注意力参数还包括至少以下之一:
基于所述待翻译词句中每一个词语的所述编码信息中的第一序列向量进行线性变换后得到的第二序列向量;
基于所述待翻译词句中每一个词语的所述编码信息中的第一内容向量进行线性变换后得到第二内容向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米智能科技有限公司,未经北京小米智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910888623.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:文档验收方法、装置、计算机设备及存储介质
- 下一篇:文本分类方法和装置