[发明专利]一种基于多约束项的蒙汉神经机器翻译方法在审
申请号: | 202210277518.4 | 申请日: | 2022-03-21 |
公开(公告)号: | CN114818743A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 吉亚图;李佳根;巴音图;师磊;樊静;苏依拉;仁庆道尔吉 | 申请(专利权)人: | 内蒙古工业大学 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06N3/04;G06N3/08 |
代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
地址: | 010080 内蒙古自治区呼*** | 国省代码: | 内蒙古;15 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 约束 神经 机器翻译 方法 | ||
1.一种基于多约束项的蒙汉神经机器翻译方法,其特征在于,包括如下步骤:
步骤1,在以BLEU值为训练优化目标的基础上,加入约束条件,构建基于强化学习的蒙汉神经机器翻译模型,所述约束条件包括:
(1)语义约束,以缓解单一的BLEU值评价体系带来的译文流利度差的问题;
(2)参数约束,以提升模型训练的效率;
(3)对语料的词表约束,以减少译文中未登录词的数量;
步骤2,对构建的翻译模型进行训练,训练策略包括交叉熵训练、强化训练以及两种训练的动态融入。
2.根据权利要求1所述基于多约束项的蒙汉神经机器翻译方法,其特征在于,所述步骤1构建翻译模型,将强化学习算法映射到机器翻译中,强化学习的学习体、环境、参数优化方法、探索动作、学习体参数状态、回报奖励,分别对应机器翻译中的翻译模块、不同时间步的输入、模型训练方法、序列解码、网络参数、序列的BLEU值;所述不同时间步的输入为蒙古文词干词缀或词表征单元,所述序列解码为以一个元素为单位的解码。
3.根据权利要求2所述基于多约束项的蒙汉神经机器翻译方法,其特征在于,所述映射的构建是以马尔可夫决策方法将机器翻译视为一个单变量探索奖励的过程,即:
学习体通过迭代性的探索动作不断改变其参数状态以获得更多的回报奖励,并在此迭代训练基础上不断与环境互动,过程表示为M=S,A,P{s,a},R,其中,s∈S,s表示学习体的参数状态,S是学习体参数状态的有限集,用于表示翻译模型在训练中不同时间步的网络参数;a∈A,a表示探索动作,A是探索动作的有限集,用于记录学习体在不同状态下的探索动作;P{s,a}表示学习体根据当前时间步的参数状态s和探索动作a预测下一个参数状态s′;R表示表示学习体采取探索动作a后的即时回报奖励;
基于所述映射,所述翻译模型从随机状态中通过不断优化网络参数,从而在探索动作中获取奖励和惩罚,并在奖罚机制下找到最优的网络参数,然后不断更新,做出最优选择。
4.根据权利要求2所述基于多约束项的蒙汉神经机器翻译方法,其特征在于,所述交叉熵训练中,翻译模型在每个时间步均将标准译文E中的元素向量et∈E和神经网络隐藏层的输出ht作为输入,计算下一时间步隐藏层的输出ht+1,直至翻译模型最终输出完整的译文向量E′,其中,E表达为E<e1,e2,...,et,...,eT>,et为E中第t个时间步编码得到的元素向量,T为E的向量长度;E′表达为E′<e′1,e′2,...,e′t,...e′T>,e′t为E′中的第t时间步解码得到的向量元素;ht是一个浮点型实值向量,用于编码训练中当前时间步之前的计算输出的结果;
所述强化训练中,翻译模型依据以BLEU值为优化目标的REINFORCE算法做出对应的解码行动,并且通过比较当前模型按概率输出的多个译文构成的候选集中的预测序列与最佳序列,在每个输出的预测序列末尾或序列长度之后观察回报奖励,所述序列长度等于所述E的向量长度,即T。
5.根据权利要求4所述基于多约束项的蒙汉神经机器翻译方法,其特征在于,所述动态融入是指在蒙汉机器翻译有限的训练周期内,将强化训练与交叉熵训练动态地加入翻译模型的整体训练过程中,其执行算法如下:
1)将蒙古语做词干词缀级嵌入化训练,得到相应的词向量空间,并给定三个变量:交叉熵训练回合NCE、强化训练回合NRL以及序列长度T;
2)在每轮的训练迭代中以序列长度为起始标志,1为结束标志,使用交叉熵作为损失函数训练NCE轮;
3)以Δ为差,逐步减少交叉熵训练轮数,并相应增加强化训练轮数NRL,Δ为训练超参;
4)使用NRL训练,在前T-Δ步用交叉熵训练,剩下的训练步用强化训练,直至强化训练完全参与整体训练,翻译模型收敛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于内蒙古工业大学,未经内蒙古工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210277518.4/1.html,转载请声明来源钻瓜专利网。