[发明专利]多模型联合去噪训练在审
申请号: | 202110338761.8 | 申请日: | 2021-03-30 |
公开(公告)号: | CN115146654A | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 寿林钧;公明;白轩宇;王旭光;姜大昕 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F40/58 | 分类号: | G06F40/58;G06F40/284;G06F40/211;G06K9/62 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 张立达 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 联合 训练 | ||
本公开提出了用于多模型联合去噪训练的方法和装置。可以获得多个模型。可以通过所述多个模型来对一组训练样本进行去噪。可以利用经去噪的一组训练样本来训练所述多个模型。
背景技术
自然语言理解(Natural Language Understanding,NLU)是使用自然语言与计算机进行通信的技术,其旨在使计算机能够理解和运用自然语言来实现人机之间的通信,从而代替人来执行与自然语言有关的各种任务,例如口语理解(Spoken LanguageUnderstanding,SLU)任务、机器阅读理解(Machine Reading Comprehension,MRC)任务、问答(Question Answering,QA)任务等。可以通过经训练的机器学习模型来执行NLU任务。机器学习模型执行NLU任务的表现依赖于大量且可靠的训练数据。对于诸如英语之类的资源丰富语言而言,存在针对一些NLU任务的大规模的人类标注的训练数据。因此,这些NLU任务在资源丰富语言上具有出色表现。
发明内容
提供本发明内容以便介绍一组构思,这组构思将在以下的具体实施方式中做进一步描述。本发明内容并非旨在标识所保护主题的关键特征或必要特征,也不旨在用于限制所保护主题的范围。
本公开的实施例提出了用于多模型联合去噪训练的方法和装置。可以获得多个模型。可以通过所述多个模型来对一组训练样本进行去噪。可以利用经去噪的一组训练样本来训练所述多个模型。
应当注意,以上一个或多个方面包括以下详细描述以及权利要求中具体指出的特征。下面的说明书及附图详细提出了所述一个或多个方面的某些说明性特征。这些特征仅仅指示可以实施各个方面的原理的多种方式,并且本公开旨在包括所有这些方面和其等同变换。
附图说明
以下将结合附图描述所公开的多个方面,这些附图被提供用以说明而非限制所公开的多个方面。
图1示出了根据本公开实施例的用于合成翻译训练样本和生成训练样本的示例性过程。
图2示出了根据本公开实施例的用于获得多个训练语料的示例性过程。
图3示出了根据本公开实施例的用于多模型联合去噪训练的示例性过程。
图4示出了根据本公开实施例的用于多模型联合去噪训练的另一示例性过程。
图5示出了根据本公开实施例的用于执行去噪和训练的示例性过程。
图6是根据本公开实施例的用于多模型联合去噪训练的示例性方法的流程图。
图7示出了根据本公开实施例的用于多模型联合去噪训练的示例性装置。
图8示出了根据本公开实施例的用于多模型联合去噪训练的示例性装置。
具体实施方式
现在将参考若干示例性实施方式来讨论本公开。应当理解,这些实施方式的讨论仅仅用于使得本领域技术人员能够更好地理解并从而实施本公开的实施例,而并非教导对本公开的范围的任何限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110338761.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:临床质谱自动前处理装置
- 下一篇:一种用作薄膜开口剂的聚酯母粒的制备方法