[发明专利]机器翻译方法、机器翻译模型的训练方法、装置及设备在审

申请号：	202011126789.7	申请日：	2020-10-20
公开（公告）号：	CN112163435A	公开（公告）日：	2021-01-01
发明（设计）人：	颜建昊;孟凡东	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G06F40/58	分类号：	G06F40/58;G06F40/211;G06N3/08;G06N3/04
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	徐立
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	机器翻译方法模型训练装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了一种机器翻译方法、机器翻译模型的训练方法、装置及设备，涉及机器翻译领域。该方法包括：获取源端句子经过嵌入编码后的编码词向量；对编码词向量进行映射处理，得到映射后的中间向量；根据映射后的中间向量之间的依赖关系，对映射后的中间向量进行拟合处理，得到拟合后的向量，依赖关系用于表征源端句子中的词语之间的关联关系；对拟合后的向量进行解码处理，输出源端句子经过翻译后的目标端句子。利用依赖关系来对映射后的中间向量拟合，输出大量符合目标端句子的向量，使得机器翻译模型输出的目标端句子更加准确。

技术领域

本申请涉及机器翻译领域，特别涉及一种机器翻译方法、机器翻译模型的训练方法、装置及设备。

背景技术

机器翻译是利用计算机将一种自然语言转变为另一种自然语言的过程，被广泛的应用到生活中的各个方面；比如，翻译助手、语音同传以及跨语言检索等，能够实现不同语种之间的无障碍交流。

通常机器翻译模型采用编码器—解码器的模型结构，编码器和解码器均包括注意力机制(Attention)模块和前馈神经网络(Feed Forward Network，FFN)模块。以机器翻译模型是加权机器翻译模型为例，加权机器翻译模型中的编码器包括多个并列的Attention模块和FFN模块。在对源端句子翻译的过程中，将源端句子输入至多个并列的Attention模块中，将多个并列的Attention模块的输出分别输入至多个并列的FFN模块中，多个并列的FFN模块输出源端句子的一个中间表示，将该中间表示作为解码器的输入，最终通过加权求和的方式得到目标端句子。

上述加权机器翻译模型中，各个并列的Attention模块和FFN模块相互独立，通过简单堆叠词语输出目标端句子，易于令翻译结果不够准确。

发明内容

本申请实施例提供了一种机器翻译方法、机器翻译模型的训练方法、装置及设备，通过对获取向量之间的依赖关系，利用依赖关系来补足目标端句子中各个词向量之间的误差，从而提高翻译结果的准确率。所述技术方案如下：

根据本申请的一方面，提供了一种机器翻译方法，所述方法包括：

获取源端句子经过嵌入编码后的编码词向量；

对所述编码词向量进行映射处理，得到映射后的中间向量；

根据所述映射后的中间向量之间的依赖关系，对所述映射后的中间向量进行拟合处理，得到拟合后的向量，所述依赖关系用于表征所述源端句子中的词语之间的关联关系；

对所述拟合后的向量进行解码处理，输出所述源端句子经过翻译后的目标端句子。

根据本申请的另一方面，提供了一种机器翻译模型的训练方法，所述方法包括：

获取样本源端句子经过嵌入编码后的样本编码词向量，所述源端句子对应有翻译结果；

对所述样本编码词向量进行偏置处理，得到经过所述偏置处理后的第一样本向量；

对所述偏置处理后的第一样本向量进行映射处理，得到映射后的第二样本向量；