[发明专利]一种神经网络蒙汉机器翻译方法有效

专利信息
申请号: 201711066025.1 申请日: 2017-11-02
公开(公告)号: CN107967262B 公开(公告)日: 2018-10-30
发明(设计)人: 苏依拉;乌尼尔;刘婉婉;牛向华;赵亚平;王宇飞;张振;孙晓骞;高芬 申请(专利权)人: 内蒙古工业大学
主分类号: G06F17/28 分类号: G06F17/28
代理公司: 西安智大知识产权代理事务所 61215 代理人: 段俊涛
地址: 010080 内蒙古自治区呼*** 国省代码: 内蒙古;15
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种神经网络蒙汉机器翻译方法,首先对大规模蒙汉双语语料做规范化处理,在此基础上构建出双语字典;然后进行建模,最终基于所搭建模型,实现机器翻译;其特征在于,所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模,从而针对蒙古语特定词性的词语进行相应处理,以达到最好的翻译效果和最小的语义困惑度。本发明首先在翻译模型中包含了蒙古语词法信息,用编码器网络对蒙古语的编码进行了较为准确的刻画;其次,算法保证了蒙汉翻译质量;最后,通过运用神经网络,把蒙汉双语翻译问题分解为对蒙古语的编码和对汉语的解码两部分,提出了可扩展性强的神经网络算法,有效提高蒙汉机器翻译译文流利度和翻译质量。
搜索关键词: 一种 神经网络 机器翻译 方法
【主权项】:
1.一种神经网络蒙汉机器翻译方法,首先对大规模蒙汉双语语料做规范化处理,在此基础上构建出双语字典;然后进行建模,最终基于所搭建模型,实现机器翻译;所述建模包括编码器建模、解码器建模以及蒙汉双语词对齐所需的注意力层的建模,从而针对蒙古语特定词性的词语进行相应处理,以达到最好的翻译效果和最小的语义困惑度,其特征在于,所述基于所搭建模型,实现机器翻译的步骤包括编码环节和解码环节,所述编码环节,将蒙古语进行向量化处理并确定维度;所述解码环节分为注意力层部分和解码部分,其中注意力层部分为对齐概率计算模型和对齐位置预测模型;通过对齐概率计算模型计算出蒙汉双语在句子对齐的基础上,词语之间对齐的概率,而对齐位置预测模型能够将每个词出现的位置信息进行相应的预测;所述解码部分又分为遍历隐藏层节点和输出两部分,通过遍历隐藏层节点来对当前时刻的向量信息进行检索,判定是否符合语义要求,若符合语义要求则将符合要求的向量信息传送给输出函数,通过归一化操作将输出向量解码为译文进行输出,且输出函数符合最优值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711066025.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top