[发明专利]一种基于神经网络的翻译方法及装置在审
申请号: | 201610545902.2 | 申请日: | 2016-07-12 |
公开(公告)号: | CN107608973A | 公开(公告)日: | 2018-01-19 |
发明(设计)人: | 涂兆鹏;李航;姜文斌 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06F17/28 | 分类号: | G06F17/28;G06N3/04 |
代理公司: | 广州三环专利商标代理有限公司44202 | 代理人: | 郝传鑫,熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 翻译 方法 装置 | ||
1.一种基于神经网络的翻译方法,其特征在于,包括:
获取待翻译句子的初始译文,所述初始译文中携带未登录词;
将所述初始译文中的未登录词拆分为字,并将所述未登录词拆分得到的字组成的字序列输入第一多层神经网络,所述字序列中包含至少一个字;
通过所述第一多层神经网络获取所述字序列中每个字的字向量,并将所述字序列的所有字向量输入第二多层神经网络;
使用所述第二多层神经网络和预置的常用词数据库,对所述所有字向量进行编码以获取所述字序列对应的语义向量;
将所述语义向量输入第三多层神经网络,通过第三多层神经网络对所述语义向量进行解码并结合所述待翻译句子的初始译文确定所述待翻译句子的最终译文,所述最终译文中携带所述未登录词的译文。
2.如权利要求1所述的翻译方法,其特征在于,所述预置的常用词数据库包括词典、语言学规则以及网络使用词数据库中的至少一种。
3.如权利要求1或2所述的翻译方法,其特征在于,所述使用所述第二多层神经网络和预置的常用词数据库,对所述所有字向量进行编码以获取所述字序列对应的语义向量包括:
使用所述第二多层神经网络根据所述常用词数据库提供的词汇信息确定所述字序列的字向量的至少一种组合方式,每个组合方式确定的字向量组合对应一个含义;
将所述至少一种组合方式确定的至少一个字向量组合的至少一个含义进行压缩编码以得到所述语义向量。
4.如权利要求3所述的翻译方法,其特征在于,所述通过第三多层神经网络对所述语义向量进行解码并结合所述待翻译句子的初始译文确定所述待翻译句子的最终译文包括:
通过所述第三多层神经网络对所述语义向量进行解码以确定所述语义向量包含的至少一个含义,并根据所述初始译文中所述未登录词的上下文含义从所述语义向量包含的至少一个含义中选择目标含义;
根据所述目标含义和所述初始译文中所述未登录词的上下文含义确定所述待翻译句子的最终译文。
5.如权利要求1-4任一项所述的翻译方法,其特征在于,所述未登录词包括:缩略词、专有名词、派生词以及复合词中的至少一种。
6.一种基于神经网络的翻译装置,其特征在于,包括:
获取模块,用于获取待翻译句子的初始译文,所述初始译文中携带未登录词;
第一处理模块,用于将所述获取模块获取的所述初始译文中的未登录词拆分为字,并将所述未登录词拆分得到的字组成的字序列输入第一多层神经网络,所述字序列中包含至少一个字;
第二处理模块,用于通过所述第一多层神经网络获取所述第一处理模块输入的所述字序列中每个字的字向量,并将所述字序列的所有字向量输入第二多层神经网络;
第三处理模块,用于使用所述第二多层神经网络和预置的常用词数据库,对所述第二处理模块输入的所述所有字向量进行编码以获取所述字序列对应的语义向量;
第四处理模块,用于将所述第三处理模块获取的所述语义向量输入第三多层神经网络,通过第三多层神经网络对所述语义向量进行解码并结合所述待翻译句子的初始译文确定所述待翻译句子的最终译文,所述最终译文中携带所述未登录词的译文。
7.如权利要求6所述的翻译装置,其特征在于,所述预置的常用词数据库包括词典、语言学规则以及网络使用词数据库中的至少一种。
8.如权利要求6或7所述的翻译装置,其特征在于,所述第三处理模块具体用于:
使用所述第二多层神经网络根据所述常用词数据库提供的词汇信息确定所述字序列的字向量的至少一种组合方式,每个组合方式确定的字向量组合对应一个含义;
将所述至少一种组合方式确定的至少一个字向量组合的至少一个含义进行压缩编码以得到所述语义向量。
9.如权利要求8所述的翻译装置,其特征在于,所述第四处理模块具体用于:
通过所述第三多层神经网络对所述第三处理模块获取的所述语义向量进行解码以确定所述语义向量包含的至少一个含义,并根据所述初始译文中所述未登录词的上下文含义从所述语义向量包含的至少一个含义中选择目标含义;
根据所述目标含义和所述初始译文中所述未登录词的上下文含义确定所述待翻译句子的最终译文。
10.如权利要求6-9任一项所述的翻译装置,其特征在于,所述未登录词包括:缩略词、专有名词、派生词以及复合词中的至少一种。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610545902.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:词性标注模型生成方法和装置
- 下一篇:一种基于条件随机场的柬‑汉人名翻译方法