[发明专利]一种文本分类方法和装置在审

申请号：	202010542761.5	申请日：	2020-06-15
公开（公告）号：	CN113761181A	公开（公告）日：	2021-12-07
发明（设计）人：	陈生泰;刘洋	申请（专利权）人：	北京京东振世信息技术有限公司
主分类号：	G06F16/35	分类号：	G06F16/35
代理公司：	中原信达知识产权代理有限责任公司 11219	代理人：	张一军;韩黎捷
地址：	100086 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种文本分类方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开了一种文本分类方法和装置，涉及计算机技术领域。该方法的一具体实施方式包括：根据第一系统的第一训练文本及所述第一训练文本的类别标签训练预设的初始分类模型，得到文本分类模型；根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型，得到预测模型；将所述第二系统的预测样本输入所述预测模型，得到所述预测样本的类别标签。该实施方式能够降低文本分类的成本，缩短文本分类的时间。

技术领域

本发明涉及计算机技术领域，尤其涉及一种文本分类方法和装置。

背景技术

在实际应用场景中，常常需要对用户反馈的文本进行分类，以确定用户反馈的问题所属的类别。目前，一般通过用户反馈的文本及其类别标签训练分类模型，利用训练后的分类模型预测文本所属的类别。

在系统升级的过程中，数据的风格会产生变化。对于同一类别的问题，在不同系统中可能存在不同的表述，例如，文本的长短和文本的用词发生变化。以第一系统升级至第二系统为例，为了适应系统的变化，现有技术对从第二系统中获取的文本进行标注，重新训练分类模型。

但是，由于需要标注大量的文本，现有技术对文本进行分类的成本较高，而且，需要花费较长的时间。

发明内容

有鉴于此，本发明实施例提供一种文本分类方法和装置，能够降低文本分类的成本，缩短文本分类的时间。

第一方面，本发明实施例提供了一种文本分类方法，包括：

根据第一系统的第一训练文本及所述第一训练文本的类别标签训练预设的初始分类模型，得到文本分类模型；

根据所述第一训练文本及其类别标签、第二系统的第二训练文本训练所述文本分类模型，得到预测模型；

将所述第二系统的预测样本输入所述预测模型，得到所述预测样本的类别标签。