[发明专利]基于多语言机器翻译模型的翻译方法、装置、设备和介质在审
申请号: | 202011409340.1 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112380876A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 赵程绮;朱耀明;王明轩;封江涛;李磊 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/30 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语言 机器翻译 模型 翻译 方法 装置 设备 介质 | ||
本公开实施例提供了一种基于多语言机器翻译模型的翻译方法、装置、设备和介质。该方法包括:获取待翻译的原始语句和所述原始语句的翻译语言信息;确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。本公开实施例通过采用上述技术方案,采用适配器校正多语言机器翻译模型的翻翻译误差,能够提高多语言翻译模型所输出的翻译结果的准确性。
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种基于多语言机器翻译模型的翻译方法、装置、设备和介质。
背景技术
机器翻译(Machine Translation,MT)是自然语言处理方向中的核心任务之一,旨在利用计算机程序将一种自然语言翻译为另一种自然语言。
传统的机器翻译模型一般为双语机器翻译模型,此类机器翻译模型能处理一个语言方向的翻译,如将英文翻译为中文。由于当语种的数量较大时,需要训练非常多的双语机器翻译模型才能实现每对语自然语言之间的两两互译,近年来,多语言机器翻译模型逐渐替代双语机器翻译模型,成为常用的机器翻译模型之一。
然而,在相同的参数配置和模型架构下,多语言机器翻译模型的性能往往劣于双语机器翻译模型的性能,导致多语言机器翻译模型输出的翻译结果的存在较大的翻译误差。
发明内容
本公开实施例提供一种基于多语言机器翻译模型的翻译方法、装置、设备和介质,以提高多语言机器翻译模型输出的翻译结果的准确性。
第一方面,本公开实施例提供了一种基于多语言机器翻译模型的翻译方法,包括:
获取待翻译的原始语句和所述原始语句的翻译语言信息;
确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;
基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。
第二方面,本公开实施例还提供了一种基于多语言机器翻译模型的翻译装置,包括:
语句获取模块,用于获取待翻译的原始语句和所述原始语句的翻译语言信息;
适配器确定模块,用于确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;
翻译模块,用于基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。
第三方面,本公开实施例还提供了一种电子设备,包括:
一个或多个处理器;
存储器,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开实施例所述的方法。
第四方面,本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开实施例所述的方法。
本公开实施例提供的基于多语言机器翻译模型的翻译方法、装置、设备和介质,获取待翻译的原始语句和该原始语句的翻译语言信息,确定与该原始语句的翻译语言信息对应的、用于校正预先设置的多语言机器翻译模型的翻译误差的目标适配器,并基于该多语言机器翻译模型和该目标适配器对原始语句进行翻译,得到目标语句。本公开实施例通过采用上述技术方案,采用适配器校正多语言机器翻译模型的翻翻译误差,能够提高多语言翻译模型所输出的翻译结果的准确性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011409340.1/2.html,转载请声明来源钻瓜专利网。