[发明专利]多模型联合去噪训练在审
申请号: | 202110338761.8 | 申请日: | 2021-03-30 |
公开(公告)号: | CN115146654A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 寿林钧;公明;白轩宇;王旭光;姜大昕 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/284;G06F40/211;G06K9/62 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 联合 训练 | ||
1.一种用于多模型联合去噪训练的方法,包括:
获得多个模型;
通过所述多个模型来对一组训练样本进行去噪;以及
利用经去噪的一组训练样本来训练所述多个模型。
2.根据权利要求1所述的方法,其中,所述一组训练样本来自训练数据集合,所述训练数据集合包括源训练语料、至少一个翻译训练语料和至少一个生成训练语料中的两个或更多个。
3.根据权利要求1所述的方法,其中,所述一组训练样本基于相同语言或者不同语言。
4.根据权利要求1所述的方法,还包括:
利用多个初始化数据组来初始化所述多个模型,所述多个初始化数据组是由包括所述一组训练样本的训练数据集合中的至少一个训练语料形成的。
5.根据权利要求1所述的方法,其中,所述一组训练样本对应于训练数据集合。
6.根据权利要求1所述的方法,其中,所述一组训练样本对应于训练数据集合中的多个训练数据子集中的一个训练数据子集,所述多个训练数据子集用于迭代地执行所述去噪和所述训练。
7.根据权利要求6所述的方法,其中,在每一次迭代中:
所述去噪包括:通过所述多个模型来对一个训练数据子集进行去噪,并且
所述训练包括:利用经去噪的训练数据子集来训练所述多个模型。
8.根据权利要求1、5和6中任一项所述的方法,其中,所述对一组训练样本进行去噪包括:
对于所述多个模型中的每个模型,通过所述多个模型中的其他模型来从所述一组训练样本中选择针对所述模型的训练样本。
9.根据权利要求8所述的方法,其中,所述选择针对所述模型的训练样本包括:
通过所述其他模型来从所述一组训练样本中滤除预定比例的训练样本;以及
将所述一组训练样本中的剩余训练样本确定为针对所述模型的训练样本。
10.根据权利要求1、5和6中任一项所述的方法,其中,所述对一组训练样本进行去噪包括:
对于所述一组训练样本中的每个训练样本,通过所述多个模型来确定所述训练样本的用于计算训练损失的权重。
11.根据权利要求10所述的方法,其中,所述确定所述训练样本的权重包括:
根据由所述多个模型基于所述训练样本所获得的多个预测结果的一致性来确定所述权重。
12.根据权利要求1、5和6中任一项所述的方法,还包括:
通过经训练的多个模型来对所述一组训练样本进行进一步去噪。
13.根据权利要求12所述的方法,其中,所述对所述一组训练样本进行进一步去噪包括:
通过经训练的多个模型来更新所述一组训练样本中的一个或多个训练样本的标注。
14.根据权利要求13所述的方法,其中,所述更新标注包括,对于所述一个或多个训练样本中的每个训练样本:
获取由经训练的多个模型基于所述训练样本所获得的多个预测结果;以及
基于所述多个预测结果来更新所述训练样本的标注。
15.根据权利要求13所述的方法,其中,所述一个或多个训练样本来自翻译训练语料和/或生成训练语料。
16.根据权利要求1所述的方法,其中,所述一组训练样本对应于训练数据集合,所述训练数据集合用于多轮地执行所述去噪和所述训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110338761.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:临床质谱自动前处理装置
- 下一篇:一种用作薄膜开口剂的聚酯母粒的制备方法