[发明专利]一种基于多任务学习的多标签文本分类方法和装置有效
申请号: | 201910491948.4 | 申请日: | 2019-06-06 |
公开(公告)号: | CN110377727B | 公开(公告)日: | 2022-06-17 |
发明(设计)人: | 杨志明 | 申请(专利权)人: | 深思考人工智能机器人科技(北京)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 杜志敏;宋志强 |
地址: | 100084 北京市海淀区上*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 学习 标签 文本 分类 方法 装置 | ||
1.一种基于多任务学习的多标签文本分类方法,其特征在于,所述方法包括:
获取训练样本,建立针对多标签文本分类的多任务学习模型;其中,所述多任务学习模型包括共享层和多特定任务层;所述共享层用于获取文本信息中的上下文关联信息;所述多特定任务层用于针对共享层输出的特征向量进行多任务分类;
基于所述训练样本对所述多任务学习模型进行训练,并在训练过程中使用反向梯度方法进行模型参数的更新;
获取待分类的文本信息时,基于所述多任务学习模型获取该待分类的文本信息的分类标签;
其中,所述多特定任务层包括:多个任务子模型;所述任务子模型的个数根据标签个数确定;
其中,所述方法进一步包括:
当所述多标签中的多个标签针对同一对象时,每个任务子模型通过二分法方式输出;
当所述多标签中的多个标签针对不同对象时,每个任务子模型根据对应对象的特点确定输出概率的个数。
2.根据权利要求1所述的方法,其特征在于,所述共享层包括:字向量提取单元和双向循环神经网络BILSTM单元;
每个任务子模型包括:多尺度卷积核卷积单元、最大池化单元、全连接层。
3.一种基于多任务学习的多标签文本分类装置,其特征在于,所述装置包括:获取单元、建立单元、第二获取单元和分类单元;
所述获取单元,用于获取训练样本;获取待分类的文本信息;
所述建立单元,用于当所述获取单元获取训练样本时,建立针对多标签文本分类的多任务学习模型;其中,所述多任务学习模型包括共享层和多特定任务层;所述共享层用于获取文本信息中的上下文关联信息;所述多特定任务层用于针对共享层输出的特征向量进行多任务分类;基于所述训练样本对所述多任务学习模型进行训练,并在训练过程中使用反向梯度方法进行模型参数的更新;
所述分类单元,用于当所述获取单元获取待分类的文本信息时,基于所述建立单元建立的多任务学习模型获取该待分类的文本信息的分类标签;
其中,所述多特定任务层包括:多个任务子模型;所述任务子模型的个数根据标签个数确定;
其中,当所述多标签中的多个标签针对同一对象时,每个任务子模型通过二分法方式输出;
当所述多标签中的多个标签针对不同对象时,每个任务子模型根据对应对象的特点确定输出概率的个数。
4.根据权利要求3所述的装置,其特征在于,
所述共享层包括:字向量提取单元和双向循环神经网络BILSTM单元;
每个任务子模型包括:多尺度卷积核卷积单元、最大池化单元、全连接层。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深思考人工智能机器人科技(北京)有限公司,未经深思考人工智能机器人科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910491948.4/1.html,转载请声明来源钻瓜专利网。