[发明专利]基于融合词性和位置信息的汉-越卷积神经机器翻译方法有效
申请号: | 201910613122.0 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110321568B | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 余正涛;王文君;王振晗;高盛祥;何建雅琳;陈玮;黄于欣 | 申请(专利权)人: | 昆明理工大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/49;G06N3/04;G06N3/08 |
代理公司: | 昆明人从众知识产权代理有限公司 53204 | 代理人: | 沈艳尼 |
地址: | 650093 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 融合 词性 位置 信息 卷积 神经 机器翻译 方法 | ||
1.基于融合词性和位置信息的汉-越卷积神经机器翻译方法,其特征在于:
所述基于融合词性和位置信息的汉-越卷积神经机器翻译方法的具体步骤如下:
Step1、收集汉越双语平行语料;
Step2、利用汉越词性标记工具对汉语和越南语进行词性信息标注;
Step3、在标记词性信息的双语语料基础上生成具有词性信息的词表;
Step4、利用带词性信息的词表对汉越双语语料进行词与词性的联合编码与解码;
Step5、通过门控线性单元融入词性信息及位置信息,并采取多层卷积神经网络及不同大小卷积核进行翻译模型的训练,生成汉-越神经机器翻译模型进行汉语越南语机器翻译;
所述Step4中,编码器与解码器同样是共享块结构,并根据固定数量的输入元素来计算中间状态;在解码器中定义了第l块的输出表示为在编码器中也定义了第l块的输出表示为每一个块包含一个一维的卷积与一个非线性函数;n表示解码器中第l块的输出的序列长度;m表示编码器中第l块的输出的序列长度;
针对不同数量的越南语音节,采用不同大小的卷积核,以获取不同程度的、完整的汉语与越南语的词法知识;如下所示,分别设置了大小为3、5、7的卷积核:
为了防止网络退化,在每个卷积层中加入残差连接,其公式如下:
其中,表示j时刻第l块的输出;v为激活函数;Wl表示第l块权重参数,bl为第l块的偏置项参数,为j时刻的先前块的解码器状态;为第个先前块到第个先前块的时间状态序列,表示第个先前块的时间状态,表示第个先前块的时间状态;
在编码器中,输入与输出的长度始终保持一致;在解码器中,从左侧开始进行m-1个全零元素的填充,之后在卷积的末尾移除m个元素;则第j+1个词的计算公式如下:
其中,p(yj+1|y1,...,yj,x)表示第j+1个词的概率,Wo为权重,bo为偏置项参数,为第j时刻解码器最顶层的输出;
在解码层中,沿用了多步注意力机制,即上层注意力为下层注意力提供信息;为了计算第l块上第j个解码器状态的总和将当前的解码器状态与先前目标元素yj的嵌入相融合,其公式如下:
其中,为融入注意力后第l块的权重参数,为融入注意力后第l块的偏置项参数,为第j时刻的解码器状态;
对于解码器第l块上第i个编码器状态与第j个解码器状态总和的注意力其计算公式如下:
其中,为第l块上第j个解码器状态总和,为第l块上第i个编码器状态;
对于上下文向量其计算公式如下:
其中,Ii表示第i个编码器的最终输入向量;
所述步骤Step5中,在融入词性信息时,以门控线性单元融入,在fairseq模型的基础上,利用门控线性单元融入词性信息和位置信息;
Step5.1、对于输入序列x=(x1,...,xm),利用门控线性单元GLU将其嵌入到分布空间e中,得到的输入向量为e1,…,em,其中,ei∈Rd是嵌入矩阵D∈Rm×d的列,其计算如下:
其中,W1,V1∈Rk×m×n为权重,b1,c1∈Rn为偏置项,σ为sigmoid函数,是点乘;Rd表示d维实数集,d表示实数集的维数,k表示卷积核的大小;
Step5.2、对于输入序列x=(x1,...,xm)对应的绝对位置序列p=(p1,...,pm)采用同样的方法嵌入到分布空间e中,其中pi∈Rd,其维度大小始终与词向量维度大小相一致,模型根据词向量的信息查找相对应的位置向量信息,且该位置向量通过GLU不断优化,其表示如下:
其中,W2,V2∈Rk×m×n为权重,b2,c2∈Rn为偏置项,σ为sigmoid函数,是点乘,为[0,1,2,3,...,m-1]中的第i个元素,得到的最终输入向量表示为:
I=(e1+p1,...,em+pm);
对于解码器得到的输出序列y=(y1,...,yn)也进行利用门控线性单元融入词性信息和位置信息的处理,具体步骤如Step5.1-Step5.2的处理过程。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910613122.0/1.html,转载请声明来源钻瓜专利网。