[发明专利]基于翻译记忆库的机器翻译方法及装置在审
申请号: | 202110203208.3 | 申请日: | 2021-02-23 |
公开(公告)号: | CN112818712A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 毛红保 | 申请(专利权)人: | 语联网(武汉)信息技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/289 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 聂俊伟 |
地址: | 430206 湖北省武汉市东湖新技术开*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 翻译 记忆 机器翻译 方法 装置 | ||
1.一种基于翻译记忆库的机器翻译方法,其特征在于,包括:
从翻译记忆库中查找与待翻译原文相似度最高的语料原文和所述语料原文的译文;
将所述待翻译原文和所述语料原文进行比较,获取所述语料原文中与所述待翻译原文不同的差异部分;
将所述差异部分映射到所述语料原文的译文,将所述语料原文的译文中差异部分映射的译文替换为掩码;
将替换后的语料原文的译文和所述待翻译原文作为机器翻译模型的输入,输出所述待翻译原文的译文;
其中,所述机器翻译模型由翻译原文样本作为样本,所述翻译原文样本对应的译文作为标签进行训练获得。
2.根据权利要求1所述的基于翻译记忆库的机器翻译方法,其特征在于,所述将替换后的语料原文的译文和所述待翻译原文作为机器翻译模型的输入,输出所述待翻译原文的译文,包括:
将所述待翻译原文输入所述机器翻译模型的第一编码器,输出所述待翻译原文的编码结果;
将所述替换后的语料原文的译文输入所述机器翻译模型的第二编码器,输出所述语料原文的译文的编码结果;
将所述待翻译原文的编码结果和语料原文的译文的编码结果输入所述机器翻译模型的解码器,输出所述待翻译原文的译文。
3.根据权利要求2所述的基于翻译记忆库的机器翻译方法,其特征在于,所述将所述待翻译原文的编码结果和语料原文的译文的编码结果输入所述机器翻译模型的解码器,输出所述待翻译原文的译文,包括:
将所述待翻译原文的编码结果和目标文本的译文的编码结果输入所述解码器的交叉注意力机制层后,依次经过所述解码器的线性处理层和softmax层,输出所述待翻译原文的译文。
4.根据权利要求1-3任一所述的基于翻译记忆库的机器翻译方法,其特征在于,所述掩码包括括号和预设字符;其中,所述预设字符位于所述括号内部。
5.根据权利要求4所述的基于翻译记忆库的机器翻译方法,其特征在于,若所述差异部分为多个,则替换每个所述差异部分映射的译文的掩码还包括每个差异部分的编号,所述编号位于所述括号内部。
6.根据权利要求1-3任一所述的基于翻译记忆库的机器翻译方法,其特征在于,所述将所述差异部分映射到所述语料原文的译文,包括:
将所述语料原文和所述语料原文的译文进行词对齐;
根据词对齐结果,将所述差异部分映射到所述语料原文的译文。
7.根据权利要求1-3任一所述的基于翻译记忆库的机器翻译方法,其特征在于,所述机器翻译模型为Transformer模型。
8.一种基于翻译记忆库的机器翻译装置,其特征在于,包括:
查找模块,用于从翻译记忆库中查找与待翻译原文相似度最高的语料原文和所述语料原文的译文;
比较模块,用于将所述待翻译原文和所述语料原文进行比较,获取所述语料原文中与所述待翻译原文不同的差异部分;
替换模块,用于将所述差异部分映射到所述语料原文的译文,将所述语料原文的译文中差异部分映射的译文替换为掩码;
翻译模块,用于将替换后的语料原文的译文和所述待翻译原文作为机器翻译模型的输入,输出所述待翻译原文的译文;
其中,所述机器翻译模型由翻译原文样本作为样本,所述翻译原文样本对应的译文作为标签进行训练获得。
9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述基于翻译记忆库的机器翻译方法的步骤。
10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述基于翻译记忆库的机器翻译方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于语联网(武汉)信息技术有限公司,未经语联网(武汉)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110203208.3/1.html,转载请声明来源钻瓜专利网。