[发明专利]翻译模型训练方法、装置及介质在审
申请号: | 202110090073.4 | 申请日: | 2021-01-22 |
公开(公告)号: | CN113609873A | 公开(公告)日: | 2021-11-05 |
发明(设计)人: | 曾显峰;孟凡东 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/42 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 朱佳 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 翻译 模型 训练 方法 装置 介质 | ||
1.一种翻译模型训练方法,其特征在于,包括:
获取多类双语平行语料,其中,每类双语平行语料包括至少一个双语语句对,每个双语语句对为相互对应且属于两个不同语种的两个语句;
针对每类双语平行语料中的每个双语语句对,分别执行以下操作,以获得更新后的多类双语平行语料:将一类双语平行语料中的一个双语语句对中的待翻译语句的部分词替换为目标语种中的近义词,其中,所述目标语种与一个双语语句对中的待翻译语句关联的语种不相同;
基于所述更新后的多类双语平行语料,对第一翻译模型进行训练,直到所述第一翻译模型满足第一模型收敛条件,获得已训练的第一翻译模型。
2.如权利要求1所述的方法,其特征在于,所述将一类双语平行语料中的一个双语语句对中的待翻译语句的部分词替换为目标语种中的近义词,包括:
从第一语种集合、第二语种集合和第三语种集合中,随机采样出目标语种,其中,所述第一语种集合包括与所述一个双语语句对中的待翻译语句关联的语种属于同个语系的语种,所述第二语种集合包括与所述一个双语语句对中的待翻译语句关联的语种属于同个语言家族的语种,所述第三语种集合包括所述多类双语平行语料关联的语种中除了所述一个双语语句对中的待翻译语句关联的语种之外的语种;
将一类双语平行语料中的一个双语语句对中的待翻译语句的部分词替换为所述目标语种对应的近义词。
3.如权利要求2所述的方法,其特征在于,所述从第一语种集合、第二语种集合和第三语种集合中,随机采样出目标语种,包括:
分别按照所述第一语种集合、所述第二语种集合和所述第三语种集合各自对应的采样概率,从所述第一语种集合、所述第二语种集合和所述第三语种集合中随机采样出所述目标语种,其中,所述第一语种集合对应的采样概率大于所述第二语种集合对应的采样概率,所述第二语种集合对应的采样概率大于所述第三语种集合对应的采样概率。
4.如权利要求1所述的方法,其特征在于,所述基于所述更新后的多类双语平行语料,对第一翻译模型进行训练,包括:
基于所述更新后的多类双语平行语料,对第一翻译模型进行多次迭代训练,其中每次迭代训练过程包括如下操作:
针对所述更新后的多类双语平行语料中的每个更新后的双语语句对,分别执行以下操作:
将一更新后的双语语句对中的两个语句,分别转换为第一向量和第二向量;
将所述第一向量输入至第一翻译模型,获得第三向量;
基于所述第三向量与所述第二向量确定损失值;
基于获得的所述损失值对所述第一翻译模型进行参数调整。
5.如权利要求4所述的方法,其特征在于,所述将所述第一向量输入至第一翻译模型,获得所述第三向量,包括:
获得所述更新后的一双语语句对中的待翻译语句关联的第一语种标识,以及所述更新后的一双语语句对中的样本翻译语句关联的第二语种标识;
将所述第一语种标识、所述第二语种标识、以及所述第一向量,输入至第一翻译模型,获得第三向量,其中,所述第三向量用于获得所述第二语种标识对应的翻译结果。
6.一种翻译模型训练方法,其特征在于,包括:
从多类双语平行语料中,选取目标双语平行语料;
采用所述目标双语平行语料,对基于权利要求1~5任一所述的方法获得的已训练的第一翻译模型进行再次训练,直到所述已训练的第一翻译模型满足第二模型收敛条件,获得已训练的第二翻译模型。
7.一种翻译方法,其特征在于,包括:
响应于针对目标文本进行的翻译请求操作,通过已训练的第一翻译模型,获得翻译结果,其中,所述已训练的第一翻译模型是通过权利要求1~5中任一项所述的方法获得的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110090073.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种综合能源系统异质能流联动优化平台
- 下一篇:半导体晶片的检测方法