[发明专利]文本分类模型的训练方法、文本分类方法及其装置在审

申请号：	202310010897.5	申请日：	2023-01-04
公开（公告）号：	CN116049400A	公开（公告）日：	2023-05-02
发明（设计）人：	谭伟;李迪	申请（专利权）人：	北京百度网讯科技有限公司
主分类号：	G06F16/35	分类号：	G06F16/35;G06F40/284;G06F40/30
代理公司：	北京清亦华知识产权代理事务所(普通合伙) 11201	代理人：	孟洋
地址：	100085 北京市***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	文本分类模型训练方法及其装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请公开了文本分类模型的训练方法、文本分类方法及其装置，涉及人工智能领域，尤其涉及自然语言处理NLP及深度学习技术等。具体实现方案为：获取第一样本文本和第一样本文本的类别标签；基于类别标签获取第一样本文本中的关键词；确定类别标签对应的掩码概率，并根据类别标签对应的掩码概率、关键词和第一样本文本，获取第二样本文本；根据第二样本文本和类别标签训练初始的文本分类模型，得到训练好的文本分类模型。本申请可以提升注意力机制的泛化能力，使得模型能够更加深入的去挖掘文本的语义信息，进而可以提升模型的效果。

技术领域

本申请涉及人工智能领域，尤其涉及自然语言处理NLP及深度学习技术等，特别的涉及一种文本分类模型的训练方法、文本分类方法及其装置。

背景技术

文本分类是自然语言处理(Natural Language Processing，NLP)中的最基础的一个任务，很多场景中都涉及到，例如对话机器人、搜索推荐、情绪识别、情感分类、内容理解、企业风控、质量检测等方向。相关技术中，基于深度学习的文本分类研究，逐渐取代传统机器学习方法成为文本分类领域的主流研究方向，所使用的深度学习模型包括卷积神经网络、循环神经网络、注意力机制等。这些深度学习模型用于文本分类领域都取得了较好的实验效果。然而，基于深度注意力机制的方法在很大程度上会过于的关注某些关键词，造成分类结果错误。

发明内容

本申请提供了一种文本分类模型的训练方法、文本分类方法、装置、电子设备以及存储介质。

根据本申请的第一方面，提供了一种文本分类模型的训练方法，包括：

获取第一样本文本和所述第一样本文本的类别标签；

基于所述类别标签获取所述第一样本文本中的关键词；

确定所述类别标签对应的掩码概率，并根据所述类别标签对应的掩码概率、所述关键词和所述第一样本文本，获取第二样本文本；

根据所述第二样本文本和所述类别标签训练初始的文本分类模型，得到训练好的文本分类模型。

根据本申请的第二方面，提供了一种文本分类方法，包括：

获取待处理文本；

将所述待处理文本输入至预设的文本分类模型，获得所述待处理文本的分类预测结果；

其中，所述文本分类模型为采用如前述第一方面所述的训练方法训练得到的模型。

根据本申请的第三方面，提供了一种文本分类模型的训练装置，包括：