[发明专利]实体关系分类模型训练方法、实体关系分类方法及装置在审
申请号: | 202210878182.7 | 申请日: | 2022-07-25 |
公开(公告)号: | CN115203420A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 叶志豪;江旺杰 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京励诚知识产权代理有限公司 11647 | 代理人: | 熊金凤 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 实体 关系 分类 模型 训练 方法 装置 | ||
1.一种实体关系分类模型训练方法,其特征在于,包括:
在任一次分类模型的训练过程中,根据基类样本集和新类样本集获取新类训练样本集和混合训练样本集,所述分类模型包括预训练的基类表征编码器、新类表征编码器和交叉对齐单元;
针对所述混合训练样本集中的每一训练文本,以所述训练文本为所述分类模型的输入,输出所述训练文本的分类概率分布,所述交叉对齐单元用于对新类原型和所述训练文本的查询表示进行交叉对齐更新,得到更新的新类原型和所述训练文本的更新查询表示,所述新类原型为所述新类训练样本集通过所述新类表征编码器的输出;
根据所述混合训练样本集中的每一训练文本的分类概率分布和所述每一训练文本的分类标签,对所述分类模型的参数进行调整,直到满足停止训练条件;
将满足所述停止训练条件所确定的所述分类模型输出为实体关系分类模型。
2.根据权利要求1所述的方法,其特征在于,所述以所述训练文本为所述分类模型的输入,输出所述训练文本的分类概率分布,包括:
将所述新类训练样本集输入所述新类表征编码器,输出所述新类原型;
以所述训练文本为所述基类表征编码器的输入,输出所述训练文本的基类特征嵌入;
以所述训练文本为所述新类表征编码器的输入,输出所述训练文本的新类特征嵌入;
根据预训练得到的基类原型、所述新类原型、复合函数、所述训练文本的基类特征嵌入和所述训练文本的新类特征嵌入,得到所述训练文本的查询表示,所述复合函数通过注意力机制计算得到;
对所述新类原型和所述训练文本的查询表示进行交叉对齐更新,得到更新的新类原型和所述训练文本的更新查询表示;
根据所述基类原型、所述更新的新类原型和所述训练文本的更新查询表示,计算得到所述训练文本的分类概率分布。
3.根据权利要求2所述的方法,其特征在于,所述对所述新类原型和所述训练文本的查询表示进行交叉对齐更新,得到更新的新类原型和所述训练文本的更新查询表示,包括:
计算所述训练文本的查询表示与所述新类训练样本集中的每个新类训练样本之间的注意力权重;
使用所述训练文本的查询表示与所述新类训练样本集中的每个新类训练样本之间的注意力权重,对所述新类训练样本集中的新类训练样本通过所述新类表征编码器的嵌入向量加权求和,得到所述更新的新类原型;
根据所述基类原型、所述更新的新类原型、复合函数、所述训练文本的基类特征嵌入和所述训练文本的新类特征嵌入,得到所述训练文本的更新查询表示。
4.根据权利要求2所述的方法,其特征在于,所述对所述新类原型和所述训练文本的查询表示进行交叉对齐更新,得到更新的新类原型和所述训练文本的更新查询表示,包括:
根据预设的交叉对齐迭代更新次数,对所述新类原型和所述训练文本的查询表示进行交叉对齐迭代更新,得到更新的新类原型和所述训练文本的更新查询表示。
5.根据权利要求4所述的方法,其特征在于,所述根据预设的交叉对齐迭代更新次数,对所述新类原型和所述训练文本的查询表示进行交叉对齐迭代更新,得到更新的新类原型和所述训练文本的更新查询表示,包括:
计算所述训练文本的第t-1轮更新查询表示与所述新类训练样本集中的每个新类训练样本之间的注意力权重,所述t大于0,所述训练文本的第0轮更新查询表示为所述训练文本的查询表示;
使用所述训练文本的第t-1轮更新查询表示与所述新类训练样本集中的每个新类训练样本之间的注意力权重,对所述新类训练样本集中的新类训练样本通过所述新类表征编码器的嵌入向量加权求和,得到第t轮更新的新类原型;
根据所述基类原型、所述第t轮更新的新类原型、复合函数、所述训练文本的基类特征嵌入和所述训练文本的新类特征嵌入,得到训练文本的第t轮更新查询表示;
重复上述过程,直到所述t等于N,所述N为所述预设的交叉对齐迭代更新次数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210878182.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:管道检测路径规划方法
- 下一篇:数据获取方法、装置、计算机设备及存储介质