[发明专利]机器翻译模型训练方法、装置及存储介质有效
申请号: | 201911281744.4 | 申请日: | 2019-12-13 |
公开(公告)号: | CN110991195B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 孙于惠;李响;李京蔚 | 申请(专利权)人: | 北京小米智能科技有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F18/24;G06F18/214 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 羊淑梅 |
地址: | 100085 北京市海淀区清河*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器翻译 模型 训练 方法 装置 存储 介质 | ||
1.一种机器翻译模型训练方法,其特征在于,所述方法包括:
获取多领域混合的训练数据集,所述训练数据集包含多个训练数据对,其中每个训练数据对包括语义相同的源语言序列和目标语言序列;
对所述训练数据集中的多个所述训练数据对进行数据领域分类,以获得至少两个领域数据子集,其中每个所述领域数据子集对应一个数据领域;
基于每个所述领域数据子集,训练所述领域数据子集对应的教师模型;
对于每个所述领域数据子集,构建优化目标函数:pT(X)+(1-p)Y,其中T(X)为所述领域数据子集对应的教师模型输出的预测概率分布,Y为所述领域数据子集所包含的各目标语言序列的真实概率分布,p为领域权重且满足0≤p≤1;
选择领域权重p的至少两个取值,基于所述优化目标函数,获得所述领域数据子集的至少两个候选优化目标;
基于所述至少两个候选优化目标,训练所述领域数据子集对应的至少两个学生模型,作为所述领域数据子集对应的至少两个候选单领域模型;
构建每个所述领域数据子集对应的测试数据集;
根据所述领域数据子集对应的测试数据集,测试所述领域数据子集对应的至少两个所述候选单领域模型的准确性;
选择测试准确性最高的候选单领域模型所对应的候选优化目标作为所述领域数据子集的指定优化目标;
基于所述训练数据集中的每个所述领域数据子集及其对应的指定优化目标,训练混合领域模型。
2.根据权利要求1所述的方法,其特征在于,所述对所述训练数据集中的多个所述训练数据对进行数据领域分类,以获得至少两个领域数据子集,其中每个所述领域数据子集对应一个数据领域,包括:
将所述多领域混合的训练数据集中的多个所述训练数据对导入数据领域分类模型,对多个所述训练数据对进行数据领域分类,以获得至少两个所述领域数据子集,每个所述领域数据子集中包含至少一个所述训练数据对。
3.根据权利要求1所述的方法,其特征在于,所述基于每个所述领域数据子集,训练所述领域数据子集对应的教师模型,包括:
以每个所述领域数据子集所包含的各目标语言序列的真实概率分布为优化目标,训练所述领域数据子集对应的教师模型。
4.根据权利要求1所述的方法,其特征在于,所述基于所述训练数据集中的每个所述领域数据子集及其对应的指定优化目标,训练混合领域模型,包括:
将每个所述领域数据子集输入至所述混合领域模型,并且按照所述领域数据子集对应的所述指定优化目标训练所述混合领域模型。
5.一种机器翻译模型训练装置,其特征在于,所述装置包括:
获取模块,用于获取多领域混合的训练数据集,所述训练数据集包含多个训练数据对,其中每个训练数据对包括语义相同的源语言序列和目标语言序列;
分类模块,用于对所述训练数据集中的多个所述训练数据对进行数据领域分类,以获得至少两个领域数据子集,其中每个所述领域数据子集对应一个数据领域;
第一训练模块,用于基于每个所述领域数据子集,训练所述领域数据子集对应的教师模型;对于每个所述领域数据子集,构建优化目标函数:pT(X)+(1-p)Y,其中T(X)为所述领域数据子集对应的教师模型输出的预测概率分布,Y为所述领域数据子集所包含的各目标语言序列的真实概率分布,p为领域权重且满足0≤p≤1;选择领域权重p的至少两个取值,基于所述优化目标函数,获得所述领域数据子集的至少两个候选优化目标;基于所述至少两个候选优化目标,训练所述领域数据子集对应的至少两个学生模型,作为所述领域数据子集对应的至少两个候选单领域模型;
测试模块,用于构建每个所述领域数据子集对应的测试数据集;根据所述领域数据子集对应的测试数据集,测试所述领域数据子集对应的至少两个所述候选单领域模型的准确性;选择测试准确性最高的候选单领域模型所对应的候选优化目标作为所述领域数据子集的指定优化目标;
第二训练模块,用于基于所述训练数据集中的每个所述领域数据子集及其对应的指定优化目标,训练混合领域模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米智能科技有限公司,未经北京小米智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911281744.4/1.html,转载请声明来源钻瓜专利网。