[发明专利]基于多语言机器翻译模型的翻译方法、装置、设备和介质在审
申请号: | 202011409340.1 | 申请日: | 2020-12-04 |
公开(公告)号: | CN112380876A | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 赵程绮;朱耀明;王明轩;封江涛;李磊 | 申请(专利权)人: | 北京有竹居网络技术有限公司 |
主分类号: | G06F40/42 | 分类号: | G06F40/42;G06F40/30 |
代理公司: | 北京远智汇知识产权代理有限公司 11659 | 代理人: | 范坤坤 |
地址: | 101299 北京市平*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 语言 机器翻译 模型 翻译 方法 装置 设备 介质 | ||
1.一种基于多语言机器翻译模型的翻译方法,其特征在于,包括:
获取待翻译的原始语句和所述原始语句的翻译语言信息;
确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;
基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。
2.根据权利要求1所述的方法,其特征在于,所述多语言机器翻译模型包括编码器和解码器,所述编码器中包含至少一个编码器次层组件,所述编码器次层组件由至少一个编码器次层构成;所述解码器中包含至少一个解码器次层组件,所述解码器次层组件由至少一个解码器次层构成,各编码器次层组件和各解码器次层组件均设置有与不同翻译语言信息对应的不同适配器。
3.根据权利要求2所述的方法,其特征在于,所述基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句,包括:
采用所述多语言机器翻译模型对所述原始语句进行翻译,并采用各次层组件的第一目标适配器对所述次层组件的原始输出值进行校正,以得到目标语句,所述次层组件包括编码器次层组件和/或解码器次层组件。
4.根据权利要求3所述的方法,其特征在于,所述采用所述多语言机器翻译模型对所述原始语句进行翻译,并采用各次层组件的第一目标适配器对所述次层组件的原始输出值进行校正,以得到目标语句,包括:
依据各次层组件在多语言机器翻译模型中的连接关系,将所述多语言机器翻译模型中的首个次层组件确定为当前次层组件,并获取所述当前次层组件的目标输入数据;
将所述当前次层组件的第一目标适配器确定为当前目标适配器;
分别将所述目标输入数据输入至所述当前次层组件和所述当前目标适配器中,以得到所述当前次层组件的原始输出数据以及所述当前目标适配器输出的当前校正参数;
采用所述当前校正参数对所述原始输出数据进行校正,得到所述当前次层组件的目标输出数据;
将所述目标输出数据确定为下一次层组件的目标输入数据,并将所述下一次层组件确定为当前次层组件,返回执行将当前次层组件的目标适配器确定为当前目标适配器的操作,直至不存在下一次层组件为止;
当不存在下一次层组件时,将所述当前次层组件的目标输出数据输入至所述当前次层组件的下一层中,以得到目标语句。
5.根据权利要求3或4所述的方法,其特征在于,所述多语言机器翻译模型还包括输入词嵌入层和输出词嵌入层,所述输入词嵌入层的输出端与所述多语言机器翻译模型中的首个编码器次层组件的输入端相连,所述输出词嵌入层的输出端与所述多语言机器翻译模型中的首个解码器次层组件的输入端相连。
6.根据权利要求5所述的方法,其特征在于,还包括:
当接收到词嵌入层的原始词嵌入输出数据时,将所述原始词嵌入输出数据输入到所述词嵌入层的第二目标适配器中,并获取所述第二目标适配器输出的词嵌入校正参数,其中,所述词嵌入层为输入词嵌入层或输出词嵌入层;
采用所述词嵌入校正参数对所述原始词嵌入输出数据进行校正,得到所述词嵌入层的目标词嵌入输出数据,以将所述目标词嵌入输出数据作为所述词嵌入层连接的次层组件的目标输入数据。
7.根据权利要求1-4任一所述的方法,其特征在于,在所述获取待翻译的原始语句和目标待翻译语言信息之前,还包括:
针对每一种翻译语言信息,获取与所述翻译语言信息相符的多个训练样本,并将各所述训练样本输入至多语言机器翻译模型中,以训练得到与所述翻译语言信息对应的适配器。
8.一种基于多语言机器翻译模型的翻译装置,其特征在于,包括:
语句获取模块,用于获取待翻译的原始语句和所述原始语句的翻译语言信息;
适配器确定模块,用于确定与所述原始语句的翻译语言信息对应的目标适配器,其中,所述目标适配器用于校正预先设置的多语言机器翻译模型的翻译误差;
翻译模块,用于基于所述多语言机器翻译模型和所述目标适配器对所述原始语句进行翻译,得到目标语句。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京有竹居网络技术有限公司,未经北京有竹居网络技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011409340.1/1.html,转载请声明来源钻瓜专利网。