[发明专利]一种基于生成式多任务学习模型的文本分类方法有效
申请号: | 201910648695.7 | 申请日: | 2019-07-18 |
公开(公告)号: | CN110347839B | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 谢松县;高辉;陈仲生;彭立宏 | 申请(专利权)人: | 湖南数定智能科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 董惠文 |
地址: | 410000 湖南省长沙市高*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明构建一种基于生成式多任务学习模型的文本分类方法,通过训练集根据多标签分类任务和层次分类任务交替对所述多任务分类模型进行解码,解码获得与编码时刻特征向量相关的当前时刻语义特征并进行训练;根据训练结果和真实标签集对多任务分类模型进行优化,获得优化多任务分类模型;将待测集中的数据输入上述优化多任务分类模型,分别获得分类标签从而完成分类;上述模型在训练过程中通过多任务机制构建了多标签分类模型与层次分类模型之间的语义关联性,因此可以增强两个子任务预测结果之间的语义关联,从而达到提升子任务分类性能目的。 | ||
搜索关键词: | 一种 基于 生成 任务 学习 模型 文本 分类 方法 | ||
【主权项】:
1.一种基于生成式多任务学习模型的文本分类方法,其特征在于,包括如下步骤:S1.对训练集中的各文本语料按照多标签分类和层次分类分别进行标定各自构建真实标签集;S2.基于多任务学习机制构建多任务分类模型,通过训练集根据共享编码器进行编码,根据多标签分类任务和层次分类任务交替对所述多任务分类模型进行解码并得到训练分类标签;S3.根据训练分类标签和真实标签计算损失值,并采用多标签分类任务和层次分类任务交替训练的方法对模型进行优化训练,获得优化分类模型;S4.将待测试集的各文本语料输入优化模型获得预测分类标签。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南数定智能科技有限公司,未经湖南数定智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910648695.7/,转载请声明来源钻瓜专利网。