[发明专利]机器翻译方法、装置及存储介质在审
申请号: | 202310319446.X | 申请日: | 2023-03-22 |
公开(公告)号: | CN116468051A | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 李宗耀;魏代猛;商恒超;郭嘉鑫;赵艳青 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58 |
代理公司: | 北京格罗巴尔知识产权代理事务所(普通合伙) 11406 | 代理人: | 项军花 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 装置 存储 介质 | ||
1.一种机器翻译方法,其特征在于,所述方法包括:
获取源语言的原文信息;
根据目标显示区域的区域信息和所述原文信息,确定目标译文长度,所述目标显示区域为用于显示译文信息的区域;
根据所述原文信息和所述目标译文长度,调用机器翻译模型输出得到目标语言的目标译文信息,所述目标语言不同于所述源语言,所述目标译文信息的长度小于或等于所述目标译文长度;
在所述目标显示区域中显示所述目标译文信息。
2.根据权利要求1所述的方法,其特征在于,所述根据目标显示区域的区域信息和所述原文信息,确定目标译文长度,包括:
获取所述目标显示区域的区域尺寸和字体尺寸;
根据所述区域尺寸和所述字体尺寸,确定最大文本长度,所述最大文本长度为所述目标显示区域中显示的字符数量或子词数量的上限值;
根据所述最大文本长度和所述原文信息,确定所述目标译文长度。
3.根据权利要求2所述的方法,其特征在于,所述根据所述最大文本长度和所述原文信息,确定所述目标译文长度,包括:
根据所述原文信息,预测对应的译文信息的第一译文长度;
当所述第一译文长度小于或等于所述最大文本长度,将所述第一译文长度确定为所述目标译文长度;
当所述第一译文长度大于所述最大文本长度时,将所述第一译文长度的预设比例确定为所述目标译文长度,所述目标译文长度小于所述第一译文长度。
4.根据权利要求1至3任一所述的方法,其特征在于,所述方法还包括:
当所述目标显示区域的区域尺寸发生调整时,根据调整后的所述目标显示区域的区域尺寸和所述原文信息,确定第二译文长度,所述第二译文长度不同于所述目标译文长度;
根据所述原文信息和所述第二译文长度,调用所述机器翻译模型输出得到第二译文信息,所述第二译文信息的长度小于或等于所述第二译文长度,所述第二译文信息不同于所述目标译文信息;
在所述目标显示区域中显示所述第二译文信息。
5.根据权利要求1至4任一所述的方法,其特征在于,所述机器翻译模型为基于掩码机制的非自回归翻译NAT模型。
6.根据权利要求1至5任一所述的方法,其特征在于,所述方法还包括:
获取多个样本原文;
对于每个所述样本原文,生成对应的不同长度的多个样本译文,每个所述样本译文与所述样本原文组成伪双语语料;
根据生成的多组所述伪双语语料,训练所述机器翻译模型;
其中,所述样本原文的语言为所述源语言和所述目标语言中的一种,所述样本译文的语言为所述源语言和所述目标语言中的另一种。
7.根据权利要求6所述的方法,其特征在于,所述样本原文的语言为所述源语言,所述样本译文的语言为所述目标语言,所述对于每个所述样本原文,生成对应的不同长度的多个样本译文,包括:
对于每个所述样本原文,分别采用不同的长度标签进行解码,得到对应的不同长度的多个所述样本译文,所述长度标签指示所述样本译文的长度范围。
8.根据权利要求6所述的方法,其特征在于,所述样本原文的语言为所述目标语言,所述样本译文的语言为所述源语言,所述对于每个所述样本原文,生成对应的不同长度的多个样本译文,包括:
对于每个所述样本原文,采用随机采样方式进行解码,得到对应的不同长度的多个所述样本译文。
9.一种机器翻译装置,其特征在于,所述装置包括:
获取单元,用于获取源语言的原文信息;
确定单元,用于根据目标显示区域的区域信息和所述原文信息,确定目标译文长度,所述目标显示区域为用于显示译文信息的区域;
输出单元,用于根据所述原文信息和所述目标译文长度,调用机器翻译模型输出得到目标语言的目标译文信息,所述目标语言不同于所述源语言,所述目标译文信息的长度小于或等于所述目标译文长度;
显示单元,用于在所述目标显示区域中显示所述目标译文信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310319446.X/1.html,转载请声明来源钻瓜专利网。