[发明专利]一种神经网络蒙汉机器翻译方法有效
申请号: | 201711066025.1 | 申请日: | 2017-11-02 |
公开(公告)号: | CN107967262B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 苏依拉;乌尼尔;刘婉婉;牛向华;赵亚平;王宇飞;张振;孙晓骞;高芬 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F17/28 | 分类号: | G06F17/28 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种神经网络蒙汉机器翻译方法,首先对大规模蒙汉双语语料做规范化处理,在此基础上构建出双语字典;然后进行建模,最终基于所搭建模型,实现机器翻译;其特征在于,所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模,从而针对蒙古语特定词性的词语进行相应处理,以达到最好的翻译效果和最小的语义困惑度。本发明首先在翻译模型中包含了蒙古语词法信息,用编码器网络对蒙古语的编码进行了较为准确的刻画;其次,算法保证了蒙汉翻译质量;最后,通过运用神经网络,把蒙汉双语翻译问题分解为对蒙古语的编码和对汉语的解码两部分,提出了可扩展性强的神经网络算法,有效提高蒙汉机器翻译译文流利度和翻译质量。 | ||
搜索关键词: | 一种 神经网络 机器翻译 方法 | ||
【主权项】:
1.一种神经网络蒙汉机器翻译方法,首先对大规模蒙汉双语语料做规范化处理,在此基础上构建出双语字典;然后进行建模,最终基于所搭建模型,实现机器翻译;所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模,从而针对蒙古语特定词性的词语进行相应处理,以达到最好的翻译效果和最小的语义困惑度,其特征在于,所述基于所搭建模型,实现机器翻译的步骤包括编码环节和解码环节,所述编码环节,将蒙古语进行向量化处理并确定维度;所述解码环节分为注意力层部分和解码部分,其中注意力层部分为对齐概率计算模型和对齐位置预测模型;通过对齐概率计算模型计算出蒙汉双语在句子对齐的基础上,词语之间对齐的概率,而对齐位置预测模型能够将每个词出现的位置信息进行相应的预测;所述解码部分又分为遍历隐藏层节点和输出两部分,通过遍历隐藏层节点来对当前时刻的向量信息进行检索,判定是否符合语义要求,若符合语义要求则将符合要求的向量信息传送给输出函数,通过归一化操作将输出向量解码为译文进行输出,且输出函数符合最优值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711066025.1/,转载请声明来源钻瓜专利网。