[发明专利]多语言翻译方法、装置、电子设备及存储介质在审

专利信息
申请号: 202111271484.X 申请日: 2021-10-29
公开(公告)号: CN114139556A 公开(公告)日: 2022-03-04
发明(设计)人: 张家俊;王迁;宗成庆 申请(专利权)人: 中国科学院自动化研究所
主分类号: G06F40/58 分类号: G06F40/58;G06F40/44
代理公司: 北京路浩知识产权代理有限公司 11002 代理人: 乔慧
地址: 100190 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 语言 翻译 方法 装置 电子设备 存储 介质
【说明书】:

发明提供一种多语言翻译方法、装置、电子设备及存储介质,方法包括:获取训练数据和源语言的文本;其中,训练数据包括源语言到多种目标语言的双语平行句对和多语言平行句对;对源语言的文本进行编码,得到源语言的文本对应的特征向量;其中,特征向量与目标语言无关;基于特征向量和多种目标语言已生成的译文,确定多种目标语言的当前词的最终表示;基于语言独立的柱搜索算法及多种目标语言的当前词的最终表示,对多种目标语言的已生成最优候选译文进行扩展,得到多种目标语言的目标译文。本发明提供的方法,能够利用多种目标语言之间的互补信息,生成多种目标语言的目标译文,同时提升多种目标语言的翻译质量。

技术领域

本发明涉及自然语言处理技术领域,尤其涉及一种多语言翻译方法、装置、电子设备及存储介质。

背景技术

机器翻译是自然语言处理领域的一个热点问题,其目标是使用计算机技术,将一种语言的文本自动翻译为其他语言的文本。近些年来,基于神经网络的机器翻译方法相比于传统的统计机器翻译方法取得了明显的提升。使用神经网络的机器翻译模型,通过扩展源端或目标端的语言数据,建立一种语言集合到另一种语言集合之间的映射关系,在同一个模型中处理多种语言之间的翻译,从而提高部署应用的效率。

相关技术中,关于多语言机器翻译的研究通常做法是通过完全参数共享的方式,使用单个翻译模型处理多种语言对之间的翻译。在这种方法中,所有语言对共享相同的词表和模型参数,仅通过在输入源端语言句子前加标签的方式指定翻译的目标语言。

然而,参数共享的多语言机器翻译方法只在训练阶段使用了不同语言之间的互补信息,而在解码阶段,不同语言仍是独立生成,而且只能生成一种目标语言。在需要多种目标语言翻译的译文场景中,每个目标独立、串行地生成,无法同时高效生成多种目标语言,且无法利用多种目标语言的互补信息。

发明内容

本发明提供一种多语言翻译方法,用以解决相关技术中无法同时生成多种目标语言,且无法利用多种目标语言的互补信息的缺陷,实现利用多种目标语言的互补信息同时生成多种目标语言。

本发明提供一种多语言翻译方法,包括:

获取训练数据和源语言的文本;其中,所述训练数据包括所述源语言到多种目标语言的双语平行句对和多语言平行句对;

对所述源语言的文本进行编码,得到所述源语言的文本对应的特征向量;其中,所述特征向量与所述多种目标语言无关;

基于所述特征向量和所述多种目标语言的已生成译文,确定所述多种目标语言的当前词的最终表示;

基于语言独立的柱搜索算法及所述多种目标语言的当前词的最终表示,对所述多种目标语言的已生成最优候选译文进行扩展,得到所述多种目标语言的目标译文。

根据本发明提供的一种多语言翻译方法,所述基于所述特征向量和所述多种目标语言的已生成译文,确定所述多种目标语言的当前词的最终表示,包括:

基于所述特征向量和所述多种目标语言的已生成译文,确定所述多种目标语言的隐层状态;

基于所述多种目标语言的隐层状态,确定任意两种语言之间的注意力;

基于所述任意两种语言之间的注意力,确定所述多种目标语言的当前词到所述源语言的文本和所述多种目标语言的已生成译文的跨语言注意力;

基于所述多种目标语言的当前词到所述源语言的文本和所述多种目标语言的已生成译文的跨语言注意力,通过非线性变换更新所述多种目标语言的隐层状态,得到所述多种目标语言的当前词的最终表示。

根据本发明提供的一种多语言翻译方法,所述基于语言独立的柱搜索算法及所述多种目标语言的当前词的最终表示,对所述多种目标语言的已生成最优候选译文进行扩展,得到所述多种目标语言的目标译文,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111271484.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top