[发明专利]基于层预测的语言翻译的方法、设备、装置和介质在审
申请号: | 202111191528.8 | 申请日: | 2021-10-13 |
公开(公告)号: | CN113935338A | 公开(公告)日: | 2022-01-14 |
发明(设计)人: | 周浩;黄晨阳;牟力立;李磊;奥斯马尔·扎安 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/58;G06N3/04 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 李峥宇 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 预测 语言 翻译 方法 设备 装置 介质 | ||
根据本公开的实现方式,提供了基于层预测的语言翻译的方法、设备、装置和介质。在一种方法中,在翻译模型的解码器的多个隐式层中的第一隐式层处,基于训练数据中包括的输入数据的编码,确定与第一隐式层相关联的第一隐式状态,训练数据包括以源语言表示的输入数据和以目标语言表示的输出数据。确定与输出数据相关联的预测信息。基于第一隐式状态和预测信息,生成更新的第一隐式状态。向多个隐式层中的第一隐式层之后的第二隐式层输出更新的第一隐式状态,以使得更新的第一隐式状态被作为与第二隐式层相关联的第二隐式状态。以此方式,通过向每个隐式层提供预测信息,可以以更为有效和准确的方式实现翻译模型。
技术领域
本公开的示例性实现方式总体涉及计算机领域,特别地涉及基于层预测的语言翻译的方法、设备、装置和计算机可读存储介质。
背景技术
语言翻译涉及将以源语言表示的内容翻译为以目标语言表示的内容。目前已经提出了多种翻译方案,然而已有技术方案的翻译速度和准确性并不令人满意。因而,期望能够以更为有效和准确的方式来执行语言翻译。
发明内容
根据本公开的示例性实现方式,提供了一种基于层预测的语言翻译的方案。
在本公开的第一方面,提供了一种基于层预测的语言翻译的方法。在该方法中,在翻译模型的解码器的多个隐式层中的第一隐式层处,基于训练数据中包括的输入数据的编码,确定与第一隐式层相关联的第一隐式状态,训练数据包括以源语言表示的输入数据和以目标语言表示的输出数据,翻译模型用于将输入数据翻译为输出数据。确定与输出数据相关联的预测信息。基于第一隐式状态和预测信息,生成更新的第一隐式状态。向多个隐式层中的第一隐式层之后的第二隐式层输出更新的第一隐式状态,以使得更新的第一隐式状态被作为与第二隐式层相关联的第二隐式状态。
在本公开的第二方面,提供了一种电子设备,包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使设备执行动作。该动作包括:在翻译模型的解码器的多个隐式层中的第一隐式层处,基于训练数据中包括的输入数据的编码,确定与第一隐式层相关联的第一隐式状态,训练数据包括以源语言表示的输入数据和以目标语言表示的输出数据,翻译模型用于将输入数据翻译为输出数据;确定与输出数据相关联的预测信息;基于第一隐式状态和预测信息,生成更新的第一隐式状态;以及向多个隐式层中的第一隐式层之后的第二隐式层输出更新的第一隐式状态,以使得更新的第一隐式状态被作为与第二隐式层相关联的第二隐式状态。
在本公开的第三方面,提供了一种基于层预测的语言翻译的方法。在该方法中,接收以源语言表示的待翻译数据的编码,确定与翻译模型中的多个隐式层中的第一隐式层相关联的第一隐式状态,翻译模型用于将以源语言表示的待翻译数据翻译为以目标语言表示的翻译结果。基于第一隐式状态确定与翻译结果相关联的预测信息。基于第一隐式状态和预测信息,生成更新的第一隐式状态更新。向多个隐式层的第一隐式层之后的第二隐式层,输入更新的第一隐式状态,以使得翻译模型将更新的第一隐式状态作为与第二隐式层相关联的第二隐式状态。
在本公开的第四方面,提供了一种电子设备,包括:至少一个处理单元;以及至少一个存储器,至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令,指令在由至少一个处理单元执行时使设备执行动作。该动作包括:接收以源语言表示的待翻译数据的编码,确定与翻译模型中的多个隐式层中的第一隐式层相关联的第一隐式状态,翻译模型用于将以源语言表示的待翻译数据翻译为以目标语言表示的翻译结果;基于第一隐式状态确定与翻译结果相关联的预测信息;基于第一隐式状态和预测信息,生成更新的第一隐式状态更新;以及向多个隐式层的第一隐式层之后的第二隐式层,输出更新的第一隐式状态,以使得翻译模型将更新的第一隐式状态作为与第二隐式层相关联的第二隐式状态。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111191528.8/2.html,转载请声明来源钻瓜专利网。