[发明专利]分类方法、装置、计算机设备及存储介质在审
申请号: | 202111136661.3 | 申请日: | 2021-09-27 |
公开(公告)号: | CN114281936A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 黄剑辉 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06F16/33 | 分类号: | G06F16/33;G06F16/35;G06F40/194;G06F40/279;G06F40/30;G06N20/00 |
代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 孙晓丽 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例公开了一种分类方法、装置、计算机设备及存储介质,属于计算机技术领域。该方法包括:获取多种第一类别的类别语义特征,对待分类的文本信息进行语义提取,得到文本信息的文本语义特征,以及分别获取文本语义特征与每种类别语义特征之间的相似度;基于多种第一类别对应的相似度,从多种第一类别中,确定文本信息所属的第一目标类别。本申请实施例提供的方法,能够对任意的文本信息进行分类,如用于描述视频的文本信息,引入了用于表示类别的类别信息,以每种类别信息的类别语义特征表征每种类别,将每种类别的类别语义特征与文本信息的文本语义特征进行相似度匹配,以相似度来确定文本信息所属的类别,提升了分类准确性。
技术领域
本申请实施例涉及计算机技术领域,特别涉及一种分类方法、装置、计算机设备及存储介质。
背景技术
随着计算机技术的发展,互联网中的文本信息越来越丰富,对文本信息进行分类是非常重要的。相关技术中,通常基于样本文本信息及对应的类别标签,对分类模型进行训练,后续基于该分类模型,直接对任一文本信息进行分类,即可得到该文本信息所属的类别,但这种分类方式的准确性欠佳。
发明内容
本申请实施例提供了一种分类方法、装置、计算机设备及存储介质,能够提高分类准确性。所述技术方案如下:
一方面,提供了一种分类方法,所述方法包括:
获取多种第一类别的类别语义特征,所述类别语义特征是对所述第一类别的类别信息进行语义提取得到的;
对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度;
基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别。
另一方面,提供了一种分类装置,所述装置包括:
获取模块,用于获取多种第一类别的类别语义特征,所述类别语义特征是对所述第一类别的类别信息进行语义提取得到的;
所述获取模块,还用于对待分类的文本信息进行语义提取,得到所述文本信息的文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度;
确定模块,用于基于多种所述第一类别对应的相似度,从多种所述第一类别中,确定所述文本信息所属的第一目标类别。
在一种可能实现方式中,每种所述第一类别为一种第二类别的子类别,至少两种所述第一类别所属的第二类别不同;所述装置还包括:
分类模块,用于基于多种所述第二类别,对所述文本语义特征进行分类,得到多种所述第二类别对应的类别标签,所述第二类别对应的类别标签指示所述文本信息属于所述第二类别的可能性;
所述确定模块,还用于基于多种所述第二类别对应的类别标签,从多种所述第二类别中,确定所述文本信息所属的第二目标类别。
在另一种可能实现方式中,每种所述第一类别为一种第二类别的子类别,所述确定模块,还用于将所述第一目标类别所属的第二类别,确定为所述文本信息所属的第二目标类别。
在另一种可能实现方式中,所述获取模块,用于基于分类模型,获取多种所述第一类别的类别语义特征;基于所述分类模型,对所述文本信息进行语义提取,得到所述文本语义特征,以及分别获取所述文本语义特征与每种所述类别语义特征之间的相似度。
在另一种可能实现方式中,所述分类模型包括第一分类子模型及第二分类子模型;所述获取模块,包括:
获取单元,用于基于所述第一分类子模型,获取多种所述第一类别的类别语义特征;
提取单元,用于基于所述第二分类子模型,对所述文本信息进行语义提取,得到所述文本语义特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111136661.3/2.html,转载请声明来源钻瓜专利网。