[发明专利]一种GRU神经网络蒙汉机器翻译方法在审
申请号: | 201910940595.1 | 申请日: | 2019-09-30 |
公开(公告)号: | CN110738062A | 公开(公告)日: | 2020-01-31 |
发明(设计)人: | 苏依拉;卞乐乐;赵旭;薛媛;范婷婷;张振 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/08;G06N3/04 |
代理公司: | 61215 西安智大知识产权代理事务所 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 解码 神经网络 翻译 正向 预处理 固定长度向量 机器翻译系统 神经网络构建 机器翻译 上下文信息 转换成目标 语义 编码生成 翻译结果 方向编码 逆向编码 输出目标 双向编码 双语语料 统一处理 语句转换 源语言 向量 语句 整合 语言 混乱 | ||
1.一种GRU神经网络蒙汉机器翻译方法,首先对翻译语言进行预处理,然后对一定规模的蒙汉双语进行Encoder-Decoder模型的搭建和训练,并对蒙汉双语语料进行编码统一处理,最后基于Encoder-Decoder模型得到翻译结果,其特征在于,所述Encoder-Decoder模型是由神经网络构建而成的神经机器翻译模型,其中一个神经网络为LSTM,负责Encoder编码,其采用双向编码设置,即对源语言进行正向编码和逆向编码,将源语句转换成两个不同方向编码且固定长度的向量,两个待解码向量包含了所有的上下文信息,另外一个神经网络为GRU,负责Decoder解码,其从正向和逆向两个方向进行解码,即解码输出目标语言的时候会自动整合上下文信息,由此将编码生成的固定长度向量转换成目标语句。
2.根据权利要求1所述GRU神经网络蒙汉机器翻译方法,其特征在于,所述对翻译语言进行预处理是利用NLPIR分词技术对翻译语言进行分词。
3.根据权利要求3所述GRU神经网络蒙汉机器翻译方法,其特征在于,所述Encoder编码的计算公式为:
ht=f(xt,ht-1)
即,依据当前时刻的输入xt和上一时刻的隐藏层输出ht-1计算当前时刻的隐藏层输出ht,经过Encoder编码得到各个时刻的输出,进而计算得到最终源语句上下文的特征表示,即,以最终时刻的隐藏层输出表示源语句的上下文;
所述Decoder解码的计算公式为:
其中x1,…,xT是输入序列,y1,…,yT′是输出序列,V是解码器的初始值,即x1,…,xT,T是输入句子的长度,T’是输出句子长度,并且T和T’通常长度不致;
模型的目标函数为源语句正确翻译为目标语句的概率;
模型训练的过程即为将训练样本中源语句正确翻译为目标语句的概率最大化的过程,对于每个时刻i,当前输出为正确结果的概率计算如下
p(yi|{y1,…,yi-1})=g(yi-1,si,c)
其中g表示整个句子中间语义表示的变换函数,si是已经得到的特征向量,c是源语句上下文。
4.根据权利要求3所述GRU神经网络蒙汉机器翻译方法,其特征在于,所述Encoder-Decoder模型的Encoder编码部分不变,Decoder解码部分引入自注意力机制,解码计算时依赖的上下文信息依据Decoder网络上一时刻和全部时刻的Encoder网络隐层计算得到,不同时刻对应上下文信息不同,其中,对于每个时刻i,当前输出为正确结果的概率计算如下
p(yi|{y1,…,yi-1},C)=g(yi-1,si,ci)
其中C表示中间语义编码,此时源语句上下文c对于Decoder不同时刻有所区分,表示为ci,ci的计算公式如下所示:
eij=a(si-1,h)
ci计算公式的含义为对于Encoder编码部分所有时刻隐藏层输出的加权求和,T表示输入句子的长度,aij表示目标在输出第i个单词时输入句子第j个单词的注意力分配系数,s表示中间编码向量,h表示输入句子中第j个单词的语义编码,a(si-1,h)表示综合编码函数,eij表示总向量。Decoder解码在不同时刻对应权重则不同,ci同样应用于Decoder解码隐藏层输出的计算,以辅助隐藏层更好地表达。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910940595.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:古诗词生成方法、装置、设备及存储介质
- 下一篇:扫描装置和模块化电源