[发明专利]跨语际语言翻译的神经机器翻译模型构建及其翻译方法在审

专利信息
申请号: 202210808791.5 申请日: 2022-07-11
公开(公告)号: CN115017924A 公开(公告)日: 2022-09-06
发明(设计)人: 黄鹂;伍红梅;梁若暄;刘贵松;蒋太翔;殷光强 申请(专利权)人: 西南财经大学;喀什地区电子信息产业技术研究院
主分类号: G06F40/58 分类号: G06F40/58;G06F40/279;G06F40/30;G06F40/126;G06N3/04;G06N3/08
代理公司: 成都希盛知识产权代理有限公司 51226 代理人: 陈泽斌
地址: 610000 四*** 国省代码: 四川;51
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 跨语际 语言 翻译 神经 机器翻译 模型 构建 及其 方法
【说明书】:

本发明涉及属于机器翻译领域,提供了跨语际语言翻译的神经机器翻译模型构建及其翻译方法,适用于各类跨语际语言翻译。在训练时,基于训练子集的源语言语料进行编码,构建融合其上下文依赖关系的文本向量,然后计算得其文本表征;然后,针对该子集逐词进行解码,在每一步,首先融合历次译文文本和源文本获得混合表征,然后基于此进行焦点位置计算,获取当前焦点位置的翻译候选词;通过不同子集,在达到一定的步数后,根据候选词和真值的误差进行迭代训练。翻译方法,同样逐词进行翻译,在每一个翻译步,生成当前步基于焦点位置的翻译候选表示,并利用启发式搜索算法,选择其中全局概率值最大的候选文本作为当前步输出的译文文本,直至翻译完成。

技术领域

本发明属于机器翻译领域,具体涉及跨语际语言翻译的神经机器翻译模型构建及其翻译方法。

背景技术

语言文字是人类交流的重要途径,但是各个国家、地区和民族的语言差异造成了信息交流方面巨大的障碍,翻译是打破这个障碍最实用的途径,尤其是在经济全球化与互联网文化飞速发展的今天必不可少的工作。然而人工翻译需要翻译人员花费大量时间来学习翻译知识、语言背景,甚至文化环境,耗时耗力。机器翻译又称自动翻译,是指利用计算机将源语言翻译成目标语言的过程,对其的研究可追溯到20世纪40年代。到今天,利用机器进行语言翻译的理论和技术,在学术界和工业界的不懈努力下不断更新和成熟,主流方法从基于统计的器翻译逐步过渡到基于深度神经网络的机器翻译,简称为神经机器翻译。

神经机器翻译是基于数据驱动的翻译方法,却又区别于统计机器翻译。它把自然语言的翻译看作是学习问题,使用神经网络将源语言和目标语言文本映射到高维隐空间中进行自适应的语义转换训练,直至模型训练拟合。翻译时直接使用隐空间的映射参数对源语言文本进行转换生成译文。而统计机器翻译方法用数学模型对译文建模,利用具备一定规模的双语平行语料库训练这个模型和参数以获取语料中的翻译规则,最后利用翻译规则实现对源语言文本的翻译。两种翻译方法都具有语言无关性,只要提供平行语料库就能训练出对应的翻译模型,无需对翻译方法做根本性的修改。但神经机器翻译由于其灵活性,已成为目前最为主流的翻译方法。

目前,神经机器翻译已取得了一些应用和进展,有比较多基于深度神经网络实现的开源软件和工具包,其翻译效果达到了一定水平。如申请号为CN201810489333.3,名为一种基于分块机制的机器翻译方法的发明专利申请就公开了一种基于分块机制的神经机器翻译模型,以对文本进行分块划分后再进行机器翻译。其是基于深度循环神经网络构建的机器翻译模型,利用循环神经网络对序列信息的特殊建模方法获取文本词语的前后依赖关系,随后对其进行分块划分以实现准确度高的机器翻译模型。

神经机器翻译模型需要从大规模双语语料库中学习隐空间的映射关系,因此翻译质量受到语料库规模和语料质量的制约。理论上来说,只要数据质量足够好的双语语料库,神经机器翻译系统就能够获得高水平的翻译效果。然而实际上,在面对现实场景时存在诸多问题,一方面,面向跨语际语言翻译时,需要神经网络模型具备强大的上下文建模能力,才能应对跨语际语言因语法、句法结构上的巨大的区别产生的词语依赖建模问题;另一方面,机器翻译的具体应用中多见面向轻量设备的终端,例如在手机等设备,这些终端的存储空间和运算性能及其有限,只能支持训练好的模型参数直接用于翻译。

为了解决词语依赖建模问题,之前神经机器翻译多采用循环神经网络进行建模。循环神经网络是序列结构,源语言文本按序串行输入至网络进行逐词映射,同时前一词语的隐空间特征也会作为后一词语的部分输入帮助计算,从而建立词语间的依赖关系。循环神经网络的这种特性使得词语建模时每刻都能考虑到语言的上下文环境,是非常符合语言特性的,但也正是因此,循环神经网络对算力和时间都有较高的需求,尤其是面向长文本时。并行的注意力模型缓解了时耗的问题,该机制无需模型按序串行输入,直接对词语进行基于注意力机制的并行建模,但却产生了新的问题:由于缺乏了序列特征信息,词语间的隐空间向量非常的类似,且重构的源文本语义信息一经产生就不会再随着上下文信息更改,无法提供足够的区分信息用于预测不同时间步时的解码信息,造成模型在面对跨语际翻译时的泛化能力较弱。基于此,当前为解决深度神经网络模型在跨语际机器翻译上尚面临以下关键问题:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南财经大学;喀什地区电子信息产业技术研究院,未经西南财经大学;喀什地区电子信息产业技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202210808791.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top