[发明专利]基于人工智能的文本分类方法、装置、设备和介质在审

申请号：	202211262187.3	申请日：	2022-10-14
公开（公告）号：	CN115577106A	公开（公告）日：	2023-01-06
发明（设计）人：	刘晨晖;龚建;孙珂;齐晓辉;徐思琪;卓泽城	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/205;G06F18/2413;G06F18/25
代理公司：	北京品源专利代理有限公司 11332	代理人：	李礼
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于人工智能文本分类方法装置设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本公开提供了一种基于人工智能的文本分类及其模型训练方法、装置、设备和介质，涉及人工智能领域，具体涉及自然语言处理、深度学习技术，可应用在智慧城市、智慧政务场景下。具体实现方案为：获取待预测语句；待预测语句包括待预测文本和待预测文本的层级预测模板；层级预测模板包括依次排列的不同标签层级下的待预测类别的字符占位符；对待预测语句进行特征提取，得到待预测文本的文本预测特征和各字符占位符的表意预测特征；对文本预测特征和各表意预测特征，按照标签层级进行特征融合，得到不同标签层级的融合预测特征；根据各融合预测特征，确定待预测文本在不同标签层级下的待预测类别。根据本公开的技术，提高了文本分类结果的准确度。

技术领域

本公开涉及人工智能领域，具体涉及自然语言处理、深度学习技术，可应用在智慧城市、智慧政务场景下。

背景技术

文本分类又称自动文本分类，是指计算机将载有信息的文本，指按照一定的分类体系或规则，映射到预先给定的某一类别或某几类别主题的过程，可用于情感分析、新闻分类和意图识别等诸多场景。

发明内容

本公开提供了一种准确度更高的文本分类及其模型训练方法、装置、设备和介质。

根据本公开的一方面，提供了一种基于人工智能的文本分类方法，包括：

获取待预测语句；其中，所述待预测语句包括待预测文本和所述待预测文本的层级预测模板；所述层级预测模板包括依次排列的不同标签层级下的待预测类别的字符占位符；

对所述待预测语句进行特征提取，得到所述待预测文本的文本预测特征和各所述字符占位符的表意预测特征；

对所述文本预测特征和各所述表意预测特征，按照标签层级进行特征融合，得到不同标签层级的融合预测特征；

根据各所述融合预测特征，确定所述待预测文本在不同标签层级下的待预测类别。

根据本公开的另一方面，还提供了一种文本分类模型训练方法，包括：