[发明专利]一种信息处理方法、装置、计算机设备及存储介质有效

申请号：	201910888623.X	申请日：	2019-09-19
公开（公告）号：	CN110781674B	公开（公告）日：	2023-10-27
发明（设计）人：	吴晓琳	申请（专利权）人：	北京小米智能科技有限公司
主分类号：	G06F40/58	分类号：	G06F40/58;G06F40/284;G06F40/289;G06N3/0455;G06N3/08
代理公司：	北京善任知识产权代理有限公司 11650	代理人：	康艳青
地址：	100085 北京市海淀区清河***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种信息处理方法装置计算机设备存储介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开是关于一种信息处理方法、装置、计算机设备及存储介质，所述方法包括：利用机器翻译模型的编码器对待翻译词句进行编码，得到编码信息；保存所述全局注意力参数；利用所述机器翻译模型的解码器，在所述待翻译词句中每一个词语的所述编码信息的解码循环中，根据所述全局注意力参数确定所述解码器的全局注意力；根据所述全局注意力获得对应所述解码循环中所要预测的词语的预测结果。由于会将解码时需要用到的全局注意力参数保存起来，因此，在解码器需要利用全局注意力参数确定全局注意力时可以直接调取存储的全局注意力参数，而不需要再次通过处理编码信息得到全局注意力参数，减少解码过程中的计算量；从而提高机器翻译模型的推理效率。

技术领域

本公开涉及计算机技术领域，尤其涉及信息处理方法、装置、计算机设备及存储介质。

背景技术

机器翻译模型是由编码器和解码器构成，其中，编码器用于对输入的句子进行编码，输入到解码器，解码器用于从前向后根据编码器的输出和前面已经翻译的结果进行下一步的推理或预测。相关技术中，机器翻译模型在工作时需要处理较多的数据量，因而导致利用机器翻译模型进行推理或预测的效率低等问题。

发明内容

根据本公开实施例的第一方面，提供一种信息处理方法，包括：

利用机器翻译模型的编码器对待翻译词句进行编码，得到所述编码信息；

基于所述编码信息，获取并存储全局注意力参数；

利用所述机器翻译模型的解码器，在所述待翻译词句中每一个词语的所述编码信息的解码循环中，根据所述全局注意力参数确定所述解码器的全局注意力；

根据所述全局注意力获得对应所述解码循环中所要预测的词语的预测结果。

可选地，所述全局注意力参数还包括至少以下之一：

基于所述待翻译词句中每一个词语的所述编码信息中的第一序列向量进行线性变换后得到第二序列向量；