[发明专利]机器翻译方法、装置、电子设备和可读存储介质在审
申请号: | 202011176909.4 | 申请日: | 2020-10-28 |
公开(公告)号: | CN112329482A | 公开(公告)日: | 2021-02-05 |
发明(设计)人: | 陈坦访;王伟玮 | 申请(专利权)人: | 北京嘀嘀无限科技发展有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 北京睿派知识产权代理事务所(普通合伙) 11597 | 代理人: | 刘锋 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 装置 电子设备 可读 存储 介质 | ||
本发明实施例提供了一种机器翻译方法、装置、电子设备和可读存储介质,涉及计算机技术领域,在本发明实施例中,可以将多个预先训练的翻译子模型进行集成,然后,当多个预先训练的翻译子模型集成为一个集成翻译模型后,可以基于集成翻译模型进行翻译,相较于单个翻译子模型,集成翻译模型具有良好的翻译质量以及翻译准确度,另外,由于本发明实施例在模型集成的过程中首先确定了一个初始集成模型,然后将该初始集成模型与落选翻译子模型进行组合,最终确定集成翻译模型,通过这样的集成方式,相较于相关技术中的穷举方式,节约了模型集成的时间,提高了模型集成的效率。
技术领域
本申请涉及计算机技术领域,特别是涉及一种机器翻译方法、装置、电子设备和可读存储介质。
背景技术
目前,机器翻译被越来越多的应用至各种场景中,其中,机器翻译大部分是基于顺序到顺序(Sequence to sequence,seq2seq)框架的神经网络机器翻译,也就是编码器-解码器(encoder-decoder)结构的神经网络。
相关技术中,基于自注意(self-attention)的seq2seq机器翻译是一种主流的机器翻译方式,但是在实际应用中,机器翻译仍会出现翻译不准确的情况,因此,如何提机器翻译的翻译质量是一个需要解决的技术问题。
发明内容
有鉴于此,本发明实施例提供一种机器翻译方法、装置、电子设备和可读存储介质,以提高翻译结果的准确度以及模型集成的效率。
第一方面,提供了一种机器翻译方法,所述方法应用于电子设备,所述方法包括:
获取待翻译文本;以及
基于预先训练的集成翻译模型,将所述待翻译文本作为输入,确定所述集成翻译模型输出的翻译文本,所述集成翻译模型基于多个单独训练的翻译子模型集成得到;
其中,所述集成翻译模型基于如下步骤确定:
获取多个预先训练的翻译子模型;
基于机器翻译评估算法,在所有可能的翻译子模型组合中选取满足预定条件的至少一个翻译子模型组合作为初始集成模型,所述翻译子模型组合包括N个所述翻译子模型,N为大于等于2的预定值;以及
按照预定方式将落选翻译子模型与所述初始集成模型进行组合以确定候选翻译模型,并在所述候选翻译模型中确定所述集成翻译模型,其中,所述落选子模型为未被选入翻译子模型组合的翻译子模型。
第二方面,提供了一种机器翻译装置,所述装置应用于电子设备,所述装置包括:
第一获取模块,用于获取待翻译文本;以及
翻译模块,用于基于预先训练的集成翻译模型,将所述待翻译文本作为输入,确定所述集成翻译模型输出的翻译文本,所述集成翻译模型基于多个单独训练的翻译子模型集成得到;
其中,所述集成翻译模型基于如下装置确定:
第二获取模块,用于获取多个预先训练的翻译子模型;
初始集成模型确定模块,用于基于机器翻译评估算法,在所有可能的翻译子模型组合中选取满足预定条件的至少一个翻译子模型组合作为初始集成模型,所述翻译子模型组合包括N个所述翻译子模型,N为大于等于2的预定值;以及
集成翻译模型确定模块,用于按照预定方式将落选翻译子模型与所述初始集成模型进行组合以确定候选翻译模型,并在所述候选翻译模型中确定所述集成翻译模型,其中,所述落选子模型为未被选入翻译子模型组合的翻译子模型。
第三方面,本发明实施例提供了一种电子设备,包括存储器和处理器,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京嘀嘀无限科技发展有限公司,未经北京嘀嘀无限科技发展有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011176909.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:相控阵天线
- 下一篇:数据处理方法、数据处理装置、存储介质和电子设备