[发明专利]一种数据处理系统、方法及计算机设备有效
申请号: | 201910170622.1 | 申请日: | 2019-03-07 |
公开(公告)号: | CN110069770B | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 蒋亮;梁忠平;温祖杰;张家兴 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06F40/211 | 分类号: | G06F40/211;G06F16/35 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 刘杰 |
地址: | 开曼群岛大开曼岛*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理系统 方法 计算机 设备 | ||
本说明书公开了一种数据处理系统,方法及计算机设备,根据第一句子表示向量生成增强任务信息,基于增强任务信息对向量生成模型采用的模型参数进行调整后,生成第二句子表示向量,判断是否能被分类模型识别出真实所属类别,且不能被任务模型识别真实所属任务,若否,生成增强分类信息和减弱任务信息,对向量生成模型采用的模型参数进行的再次调整。经过多任务训练,当分类模型能根据句子表示向量进行分类,而任务模型无法根据句子生成模型生成的句子表示向量识别出所属任务的时候,说明句子生成模型直接生成的句子表示向量已经不包含特定任务的信息,可以成为通用的句子表示向量,达到生成的句子表示向量具有通用性的目的。
技术领域
本说明书涉及自然语言处理技术,特别涉及一种数据处理系统,方法及计算机设备。
背景技术
目前,自然语言处理领域使用的很多模型都是将句子转换成一个高维表示向量,然后再做自然语言处理任务,比如:进行分类、推理等。
然而,上述的很多模型生成的句子表示向量都是与任务相关的。因此,我们需提供一种模型可以生成不包含特定任务信息的句子表示向量,使得该句子表示向量的通用性比较强,可以有效地迁移到其他任务上去。
发明内容
本说明书实施例提供一种数据处理系统、方法及电子设备,用于生成通用性比较强的句子表示向量,可更容易实现知识的有效迁移。
第一方面,本说明书实施例提供一种数据处理方法,包括:
采用向量生成模型将样本数据中自然语言表述的句子转换成第一句子表示向量;
采用任务模型根据所述第一句子表示向量生成增强任务信息;
根据所述增强任务信息对所述向量生成模型的模型参数进行第一调整,并采用调整后的向量生成模型将所述样本数据中自然语言表述的句子转换成第二句子表示向量;
判断所述第二句子表示向量是否满足预设条件,所述预设条件包括:能被分类模型识别出真实所属类别,且不能被所述任务模型识别真实所属任务;
若否,则采用所述分类模型根据所述第二句子表示向量生成增强分类信息,以及采用所述任务模型根据所述第二句子表示向量生成减弱任务信息;根据所述增强分类信息和减弱任务信息对所述向量生成模型的模型参数进行第二调整;
采用经过所述第二调整的所述向量生成模型再次对所述样本数据进行处理,循环至所述向量生成模型转换的所述第二句子表示向量满足所述预设条件为止。
第二方面,本说明书实施例提供一种数据处理装置,包括句子向量生成器、通用性判别器和多任务分类器:
所述句子向量生成器,用于采用向量生成模型将样本数据中自然语言表述的句子转换成第一句子表示向量;
所述通用性判别器,用于采用任务模型根据所述第一句子表示向量生成增强任务信息;
所述句子向量生成器,还用于根据所述增强任务信息对所述向量生成模型的模型参数进行第一调整,并采用调整后的向量生成模型将所述样本数据中自然语言表述的句子转换成第二句子表示向量;
所述任务判断器,还用于判断所述第二句子表示向量是否不能被所述任务模型识别真实所属任务;
所述多任务分类器,还用于判断所述第二句子表示向量是否能被分类模型识别出真实所属类别;
在所述第二句子表示向量能被所述任务模型识别真实所属任务,或不能被分类模型识别出真实所属类别时,所述多任务分类器还用于采用所述分类模型根据所述第二句子表示向量生成增强分类信息,所述通用性判别器还用于采用所述任务模型根据所述第二句子表示向量生成减弱任务信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910170622.1/2.html,转载请声明来源钻瓜专利网。