[发明专利]机器翻译方法及装置、电子设备及存储介质有效
申请号: | 201910611919.7 | 申请日: | 2019-07-08 |
公开(公告)号: | CN110334360B | 公开(公告)日: | 2021-07-06 |
发明(设计)人: | 谢军 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/289 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 方法 装置 电子设备 存储 介质 | ||
本发明实施例公开了一种机器翻译方法及装置、电子设备及存储介质,在该方法中,在接收待翻译语句后,调用训练得到的机器翻译模型,该机器翻译模型包括分块模型和翻译模型,然后基于分块模型,根据待翻译词的词向量,对待翻译语句进行分块得到待翻译块,最后基于翻译模型以及待翻译块,对待翻译语句进行翻译得到翻译结果;在本发明中,由于分块模型是根据词向量对待翻译语句进行分块得到待翻译块的,这样就可以将待翻译语句划分为更小的待翻译块,进而翻译模型基于这些待翻译块进行翻译时,各待翻译块对应的翻译结果更准确,将这些待翻译块对应的翻译结果进行组合,得到整个待翻译语句的翻译结果也更准确,提高了机器翻译的准确度。
技术领域
本发明涉及语言处理领域,具体涉及一种机器翻译方法及装置、电子设备及存储介质。
背景技术
自然语言处理是计算机学科人工智能的一个重要研究方向。它研究如何使得人与计算机之间能够使用自然语言进行有效通信。它是一门融语言学、计算机科学、数学于一体的学科,其中,神经机器翻译是一个很重要的任务。
当前机器翻译方法中,为了提高翻译准确度,根据标点符号将待翻译语句划分为多个子句,并基于这些子句进行翻译;但是这种方式在子句较长时,依然无法准确翻译。
即当前机器翻译方法仍然存在不足。
发明内容
本发明实施例提供一种机器翻译方法及装置、电子设备及存储介质,以提高机器翻译的准确度。
为解决上述技术问题,本发明实施例提供以下技术方案:
本发明实施例提供一种机器翻译方法,其包括:
接收待翻译语句;所述待翻译语句由待翻译词组成;
调用训练得到的机器翻译模型;所述机器翻译模型包括分块模型和翻译模型;
基于所述分块模型,根据所述待翻译词的词向量,对所述待翻译语句进行分块得到待翻译块;所述待翻译块包括至少一个待翻译词;
基于所述翻译模型以及所述待翻译块,对所述待翻译语句进行翻译,得到翻译结果。
本发明实施例提供一种机器翻译装置,其包括:
接收模块,用于接收待翻译语句;所述待翻译语句由待翻译词组成;
调用模块,用于调用训练得到的机器翻译模型;所述机器翻译模型包括分块模型和翻译模型;
分块模块,用于基于所述分块模型,根据所述待翻译词的词向量,对所述待翻译语句进行分块得到待翻译块;所述待翻译块包括至少一个待翻译词;
翻译模块,用于基于所述翻译模型以及所述待翻译块,对所述待翻译语句进行翻译,得到翻译结果。
本发明实施例提供一种电子设备,其包括处理器和存储器,所述存储器存储有多条指令,所述指令适于处理器进行加载,以执行上述机器翻译方法中的步骤。
本发明实施例提供一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述机器翻译方法中的步骤。
本发明实施例提供了一种机器翻译方法及装置、电子设备及存储介质,在该方法中,在接收待翻译语句后,调用训练得到的机器翻译模型,该机器翻译模型包括分块模型和翻译模型,然后基于分块模型,根据待翻译词的词向量,对待翻译语句进行分块得到待翻译块,最后基于翻译模型以及待翻译块,对待翻译语句进行翻译得到翻译结果;在本发明中,由于分块模型是根据词向量对待翻译语句进行分块得到待翻译块的,这样就可以将待翻译语句划分为更小的待翻译块,进而翻译模型基于这些待翻译块进行翻译时,各待翻译块对应的翻译结果更准确,将这些待翻译块对应的翻译结果进行组合,得到整个待翻译语句的翻译结果也更准确,即本发明可以对待翻译语句进行更细粒度的分块,提高了机器翻译的准确度。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910611919.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:文本翻译方法和装置
- 下一篇:一种面向小语种语言的神经机器翻译方法