[发明专利]机器翻译的校准优化方法、装置与电子设备有效
申请号: | 201910066709.4 | 申请日: | 2019-01-24 |
公开(公告)号: | CN109670191B | 公开(公告)日: | 2023-03-07 |
发明(设计)人: | 张睦 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06V30/418;G06V30/40;G06V30/19 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 430000 湖北省武汉市东湖开发区光谷软件*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 校准 优化 方法 装置 电子设备 | ||
本发明实施例提供一种机器翻译的校准优化方法、装置与电子设备,其中所述方法包括:基于目标文档的原文和机器译文,利用训练完成的多任务学习的神经网络模型,进行机器翻译质量评估,并对所述目标文档的所述机器译文进行自动后编辑;其中,所述训练完成的多任务学习的神经网络模型是事先利用一定量的训练样本,对基础多任务学习的神经网络模型进行迭代训练更新获取的,任一所述训练样本包括样本原文、样本机器译文、样本机器翻译质量标签和样本后编辑文。本发明实施例能够有效的将机器翻译自动质量评估和自动后编辑这两个相互独立又密切相关的任务进行紧密结合,从而能够更有效的提高后编辑效率及翻译质量。
技术领域
本发明实施例涉及机器翻译技术领域,更具体地,涉及一种机器翻译的校准优化方法、装置与电子设备。
背景技术
机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程。虽然当前机器翻译系统的总体翻译质量在不断地提高,但其质量的稳定性还无法得到保障。例如,对于一些特殊任务翻译的输入,其输出的质量有时无法满足一定标准。这种情况下,翻译人员在后编辑这些质量忽高忽低的译文时,往往需要花费大量的精力和时间去做审校,这无疑会影响译员的工作效率。
机器翻译自动质量评估(Quality Estimation for Machine Translation,QE)可以对机器翻译引擎输出句子的质量进行智能预测。通过显式的质量标注,翻译人员可以轻松地选择是在机器翻译结果的基础上做后编辑,还是自己从头开始翻译。
然而,实际应用中往往希望智能辅助翻译能够更进一步地来协助翻译工作。这项任务即是自动后编辑(Automatic Post-Edit,APE)。自动后编辑任务并不是发生在机器翻译引擎的内部,而是将引擎系统视为一个黑盒,并对这个黑盒的输出在外部进行自动化的修正,以获得质量更好的译文。
那么,如何将机器翻译自动质量评估和自动后编辑这两个相互独立的任务进行有效结合以更有效的提高翻译质量的问题,成为目前业界亟待解决的需要课题。
发明内容
为了克服上述问题或者至少部分地解决上述问题,本发明实施例提供一种机器翻译的校准优化方法、装置与电子设备,用以将机器翻译自动质量评估和自动后编辑进行有效的结合,从而能够更有效的提高后编辑效率及翻译质量。
第一方面,本发明实施例提供一种机器翻译的校准优化方法,包括:
基于目标文档的原文和机器译文,利用训练完成的多任务学习的神经网络模型,进行机器翻译质量评估,并对所述目标文档的所述机器译文进行自动后编辑;
其中,所述训练完成的多任务学习的神经网络模型是事先利用一定量的训练样本,对基础多任务学习的神经网络模型进行迭代训练更新获取的,任一所述训练样本包括样本原文、样本机器译文、样本机器翻译质量标签和样本后编辑文。
第二方面,本发明实施例提供一种机器翻译的校准优化装置,包括:
数据获取模块,用于获取目标文档的原文和机器译文;
评估与后编辑输出模块,用于基于所述目标文档的原文和机器译文,利用训练完成的多任务学习的神经网络模型,进行机器翻译质量评估,并对所述目标文档的所述机器译文进行自动后编辑;
其中,所述训练完成的多任务学习的神经网络模型是事先利用一定量的训练样本,对基础多任务学习的神经网络模型进行迭代训练更新获取的,任一所述训练样本包括样本原文、样本机器译文、样本机器翻译质量标签和样本后编辑文。
第三方面,本发明实施例提供一种电子设备,包括:至少一个存储器、至少一个处理器、通信接口和总线;所述存储器、所述处理器和所述通信接口通过所述总线完成相互间的通信,所述通信接口用于所述电子设备与机器翻译设备之间的信息传输;所述存储器中存储有可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时,实现如上第一方面所述的机器翻译的校准优化方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910066709.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:翻译模型构建方法和装置
- 下一篇:一种基于BIM的构件ID批量提取方法