[发明专利]基于Multi-BiRNN编码的神经机器翻译方法有效
申请号: | 201710875429.9 | 申请日: | 2017-09-25 |
公开(公告)号: | CN107729326B | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 叶娜;张学强 | 申请(专利权)人: | 沈阳航空航天大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/55;G06N3/04;G06N3/08 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 李晓光 |
地址: | 110136 辽宁省沈*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 multi birnn 编码 神经 机器翻译 方法 | ||
1.一种基于Multi-BiRNN编码的神经机器翻译方法,其特征在于包括以下步骤:
1)在编码器端采用Multi-BiRNN编码的方法,即在源语言句子作为输入序列的基础上,再增加一组或多组BiRNN对与之相关的其他输入序列进行编码;
2)基于Multi-BiRNN编码的神经机器翻译,在源端编码过程中同时考虑源语言句子序列及其依存句法树,通过两种不同的遍历方式分别得到句法树的序列化结果,与源语言句子序列一起作为Multi-BiRNN编码的输入;
3)在各组BiRNN的输出端,采用向量拼接的方式形成每个词,使每个词更加完整和全面;
如果增加多组BiRNN对输入序列进行编码,即在单个BiRNN的基础上,增加了一组或者多组的BiRNN,则每个BiRNNj可分别生成正向隐状态和反向隐状态最终可得到2*m个隐状态,进行拼接可得到向量序列
hmn表示Multi-BiRNN中第m个BiRNN生成的第n个隐状态,m表示Multi-BiRNN中BiRNN网络层数,n表示每层BiRNN生成隐状态的个数。
2.根据权利要求1所述的基于Multi-BiRNN编码的神经机器翻译方法,其特征在于:步骤1)中,增加一组或多组BiRNN对与之相关的其他输入序列进行编码,具体为:
BiRNN1用以编码源语言句子,分别生成前向隐状态序列和后向隐状态序列
BiRNN2用以编码词性序列,分别生成前向隐状态序列和后向隐状态序列
得到上述4个隐状态序列后,分别对每一位置的隐状态依次进行拼接,最终实现将源语言句子映射为向量序列
3.根据权利要求1所述的基于Multi-BiRNN编码的神经机器翻译方法,其特征在于:步骤2)中,两种不同的遍历方式为:
对于一个源语言句子,分析为一棵依存句法树,依存句法树的遍历采用广度优先遍历或深度优先遍历;
在依存句法树中,有依存关系的短语或子句自动生长在同一棵子树中,结点之间的父子关系反应词之间的依存关系;
对于依存句法树的遍历,广度优先遍历是从根节点出发,逐层对句法树的每一个结点进行遍历;深度优先遍历则从根结点开始,每次沿着一条路径遍历,直到遍历到句法树的叶子结点再回溯到父节点,从而遍历所有结点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳航空航天大学,未经沈阳航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710875429.9/1.html,转载请声明来源钻瓜专利网。