[发明专利]文本分类方法和装置、计算机可读存储介质和电子设备在审
申请号: | 201910863069.X | 申请日: | 2019-09-12 |
公开(公告)号: | CN112487180A | 公开(公告)日: | 2021-03-12 |
发明(设计)人: | 周蕾蕾 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F16/33 |
代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 方法 装置 计算机 可读 存储 介质 电子设备 | ||
本公开实施例公开了一种文本分类方法和装置、计算机可读存储介质和电子设备,其中,文本分类方法包括:对待处理文本进行槽位信息标注;基于所述待处理文本标注的槽位信息,查询至少一个类别的槽位矩阵表,得到所述待处理文本的分类结果。本公开实施例避免了无效信息的过拟合和输入文本分类结果的过拟合,提高了文本分类结果的准确性;另外,提高了文本分类效率,使得语义理解过程的速度更快,从而提升了语义理解效率。
技术领域
本公开涉及语音识别技术,尤其是一种文本分类方法和装置、计算机可读存储介质和电子设备。
背景技术
语音识别技术,也被称为自动语音识别(Automatic Speech Recognition,ASR),是将语音转换为计算机可读的输入形式的技术。在语音识别的过程中,将语音转换为文本后,需要对文本进行语义理解,才能够将文本转换为计算机可读的输入形式,以便进行相应操作。
其中,短文本分类是语义理解的关键步骤。短文本分类,是指确定文本属于音乐、视频、天气、导航等哪个类别,例如:文本“现在给我播放青花瓷”属于音乐类别,“今天的天气”属于天气类别,等等。
发明内容
为了解决上述技术问题,提出了本公开。本公开的实施例提供了一种文本分类方法和装置、计算机可读存储介质和电子设备。
根据本公开实施例的一个方面,提供了一种文本分类方法,包括:
对待处理文本进行槽位信息标注;
基于所述待处理文本标注的槽位信息,查询至少一个类别的槽位矩阵表,得到所述待处理文本的分类结果。
根据本公开实施例的另一个方面,提供了一种文本分类装置,包括:
标注模块,用于对待处理文本进行槽位信息标注;
查询模块,用于基于所述待处理文本标注的槽位信息,查询至少一个类别的槽位矩阵表,得到所述待处理文本的分类结果。
根据本公开实施例的又一个方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行本公开上述任一实施例所述的文本分类方法。
根据本公开实施例的再一个方面,提供了一种电子设备,所述电子设备包括:
处理器;
用于存储所述处理器可执行指令的存储器;
所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现本公开上述任一实施例所述的文本分类方法。
基于本公开上述实施例提供的文本分类方法和装置、计算机可读存储介质和电子设备,对待处理文本进行槽位信息标注,基于待处理文本标注的槽位信息,查询至少一个类别的槽位矩阵表,来得到待处理文本的分类结果,相对于对原始句子进行特征提取、再用分类模型进行分类的现有短文本分类方法,由于不存在无效信息和无效特征,也未利用分类模型进行分类,因此避免了无效信息的过拟合和输入文本分类结果的过拟合,从而提高了文本分类结果的准确性;另外,本公开实施例通过查询槽位矩阵表来得到待处理文本的分类结果,相对于利用分类模型进行分类的方式,提高了文本分类效率,使得语义理解过程的速度更快,从而提升了语义理解效率。
下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。
附图说明
通过结合附图对本公开实施例进行更详细的描述,本公开的上述以及其他目的、特征和优势将变得更加明显。附图用来提供对本公开实施例的进一步理解,并且构成说明书的一部分,与本公开实施例一起用于解释本公开,并不构成对本公开的限制。在附图中,相同的参考标号通常代表相同部件或步骤。
图1是本公开所适用的场景图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910863069.X/2.html,转载请声明来源钻瓜专利网。