[发明专利]文本分类方法、装置、设备及存储介质在审
申请号: | 202110268045.7 | 申请日: | 2021-03-12 |
公开(公告)号: | CN113722474A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 张先礼;管冲;陈曦 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 设备 存储 介质 | ||
本申请公开了一种文本分类方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取待检测文本,以及待检测文本对应的关联文本;对待检测文本和关联文本进行特征提取处理,获取特征信息;采用注意力机制对特征信息进行处理,获取各个特征分别对应的注意力权重;基于特征信息和注意力权重,获取待检测文本对应的类别检测结果和结果解释信息。本申请中,类别检测结果中包括类别分布概率,使得类别检测结果具有多样性,避免仅仅输出一个类别造成的输出单一;结果解释信息用于描述各个特征针对类别检测结果的影响程度,提高了类别检测结果的可信度,为类别检测结果提供可解释性,使得用户能够更加直观地理解类别检测结果。
技术领域
本申请涉及人工智能技术领域,特别涉及一种文本分类方法、装置、设备及存储介质。
背景技术
目前,随着人工智能的发展,通过计算机设备结合深度学习模型进行文本分类的运用也越来越多。
在相关技术中,技术人员可以通过大量训练样本进行模型训练,进而采用训练完成后的深度学习模型对各个文本进行分类。例如,在医疗领域的疾病预测场景中,医护人员在对目标对象进行疾病检测时,可以将目标对象的病症描述文本输入至深度学习模型中,由深度学习模型根据病症描述文本进行疾病预测,输出目标对象对应的病理信息数据,以供医护人员作为参考。再例如,在教育领域的书籍分类场景中,工作人员在对书籍所属科目进行分类时,可以将书籍的总结描述文本(前言、后记、摘要等)输入至深度学习模型中,由深度学习模型根据总结描述文本进行书籍分类,输出书籍对应的科目信息数据作为科目分类结果。当然,基于深度学习模型的文本分类还可应用在其他多个场景中,此处不一一举例。
然而,在上述相关技术中,深度学习模型输出的文本分类结果的可信度不够高。
发明内容
本申请实施例提供了一种文本分类方法、装置、设备及存储介质,提高了类别检测结果的可信度,。所述技术方案如下:
根据本申请实施例的一个方面,提供了一种文本分类方法,所述方法包括:
获取待检测文本,以及所述待检测文本对应的关联文本;
对所述待检测文本和所述关联文本进行特征提取处理,获取特征信息;其中,所述特征信息中包括至少一个特征;
采用注意力机制对所述特征信息进行处理,获取各个所述特征分别对应的注意力权重,所述注意力权重用于指示所述特征针对所述待检测文本和所述关联文本的重要程度;
基于所述特征信息和所述注意力权重,获取所述待检测文本对应的类别检测结果和结果解释信息;其中,所述类别检测结果包括所述待检测文本对应的类别分布概率,所述结果解释信息用于描述各个所述特征针对所述类别检测结果的影响程度。
根据本申请实施例的一个方面,提供了一种文本分类模型的训练方法,所述方法包括:
获取多个样本文本,以及各个所述样本文本对应的类别信息;
从各个所述样本文本中分别提取样本特征信息;
采用所述样本特征信息和所述类别信息对所述文本分类模型进行训练;
其中,所述文本分类模型中引入注意力机制,所述注意力机制用于确定所述样本特征信息中的各个样本特征针对所述样本文本中的重要程度,所述重要程度用于确定各个所述样本特征对模型输出结果的影响程度。
根据本申请实施例的一个方面,提供了一种文本分类装置,所述装置包括:
文本获取模块,用于获取待检测文本,以及所述待检测文本对应的关联文本;
特征提取模块,用于对所述待检测文本和所述关联文本进行特征提取处理,获取特征信息;其中,所述特征信息中包括至少一个特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110268045.7/2.html,转载请声明来源钻瓜专利网。