[发明专利]跨语言的任务训练在审
申请号: | 201910447514.4 | 申请日: | 2019-05-27 |
公开(公告)号: | CN112084295A | 公开(公告)日: | 2020-12-15 |
发明(设计)人: | 梁耀波;段楠;公明;寿林钧;姜大昕;周明 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/332;G06F40/30;G06N3/08 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华;丁君军 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语言 任务 训练 | ||
1.一种计算机实现的方法,包括:
基于对第一语言的第一句子中的第一词语的掩码,生成所述第一语言的第一掩码句子;
确定与所述第一词语相对应的第二语言的第二词语,所述第一语言不同于所述第二语言;以及
使用所述第一语言的所述第一掩码句子和所述第二语言的第二词语来预训练跨语言编码器,所述跨语言编码器基于特定任务要被进一步训练。
2.根据权利要求1所述的方法,其中预训练跨语言编码器包括:
将所述第一语言的所述第一掩码句子确定为第一输入;
将所述第二语言的所述第二词语确定为第一输出;以及
使用所述第一输入和所述第一输出来预训练所述跨语言编码器。
3.根据权利要求1所述的方法,还包括:
获得所述第二语言的第二句子;
组合所述第一语言的所述第一句子和所述第二语言的所述第二句子以获得第二输入;以及
使用所述第二输入和第二输出来预训练所述跨语言编码器,所述第二输出包括指示所述第一句子和所述第二句子是否具有相同含义的标志。
4.根据权利要求1所述的方法,还包括:
获得所述第二语言的第三句子;
组合所述第一语言的所述第一句子和所述第二语言的所述第三句子以获得第三输入;以及
使用所述第三输入和第三输出来预训练所述跨语言编码器,所述第三输出包括指示所述第三句子在语义上是否为所述第一句子的下一句子的标志。
5.根据权利要求1所述的方法,还包括:
在完成对所述跨语言编码器的预训练之后,从所述第一语言的问答语料库中获得第一问答对,所述第一问答对包括第一语言的第一问题和第一回答;以及
执行以下至少一项:
将所述第一回答从所述第一语言翻译成所述第二语言,并且使用所述第一语言的第一问题和所述第二语言的第一回答来进一步训练所述跨语言编码器,以用于所述第二语言的问答,以及
将所述第一问题从所述第一语言翻译成所述第二语言,并且使用所述第二语言的第一问题和所述第一语言的第一回答来进一步训练所述跨语言编码器,以用于所述第二语言的问答。
6.根据权利要求5所述的方法,还包括:
从所述问答语料库中获得第二问答对,所述第二问答对包括第一语言的第二问题和第二回答;
将所述第二问题和所述第二回答分别从所述第一语言翻译成所述第二语言;以及
使用所述第二语言的所述第二问题和所述第二语言的所述第二回答来微调所述跨语言编码器。
7.根据权利要求6所述的方法,还包括:
响应于在搜索引擎中接收到所述第二语言的用户查询;
使用所述跨语言编码器来确定针对所述用户查询的第二语言的回答;以及
在所述搜索引擎的搜索结果页面中呈现所述第二语言的所述回答。
8.根据权利要求1所述的方法,还包括:
从所述第一语言的自然语言推理库中获得第一句子对,所述第一句子对包括第一语言的第一前提句子和第一假设句子,所述第一前提句子和所述第一假设句子之间被标记有以下关系之一:蕴含、矛盾以及中立;以及
执行以下至少一项:
将所述第一假设句子从所述第一语言翻译成所述第二语言,并且使用所述第一语言的所述第一前提句子、所述第二语言的所述第一假设句子以及所述关系来训练所述跨语言编码器,以用于所述第二语言的推理,以及
将所述第一前提句子从所述第一语言翻译成所述第二语言,并且使用所述第二语言的第一前提句子、所述第一语言的第一假设句子以及所述关系来训练所述跨语言编码器,以用于所述第二语言的推理。
9.根据权利要求1所述的方法,还包括:
确定与所述第一词语相对应的第三语言的第三词语;以及
使用所述第一语言的所述第一掩码句子和所述第三语言的第三词语来预训练跨语言编码器,以用于与所述第三语言相关联的任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910447514.4/1.html,转载请声明来源钻瓜专利网。