[发明专利]文本分类模型的训练方法、文本分类方法及其装置在审
申请号: | 202310010897.5 | 申请日: | 2023-01-04 |
公开(公告)号: | CN116049400A | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 谭伟;李迪 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/284;G06F40/30 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 孟洋 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 模型 训练 方法 及其 装置 | ||
本申请公开了文本分类模型的训练方法、文本分类方法及其装置,涉及人工智能领域,尤其涉及自然语言处理NLP及深度学习技术等。具体实现方案为:获取第一样本文本和第一样本文本的类别标签;基于类别标签获取第一样本文本中的关键词;确定类别标签对应的掩码概率,并根据类别标签对应的掩码概率、关键词和第一样本文本,获取第二样本文本;根据第二样本文本和类别标签训练初始的文本分类模型,得到训练好的文本分类模型。本申请可以提升注意力机制的泛化能力,使得模型能够更加深入的去挖掘文本的语义信息,进而可以提升模型的效果。
技术领域
本申请涉及人工智能领域,尤其涉及自然语言处理NLP及深度学习技术等,特别的涉及一种文本分类模型的训练方法、文本分类方法及其装置。
背景技术
文本分类是自然语言处理(Natural Language Processing,NLP)中的最基础的一个任务,很多场景中都涉及到,例如对话机器人、搜索推荐、情绪识别、情感分类、内容理解、企业风控、质量检测等方向。相关技术中,基于深度学习的文本分类研究,逐渐取代传统机器学习方法成为文本分类领域的主流研究方向,所使用的深度学习模型包括卷积神经网络、循环神经网络、注意力机制等。这些深度学习模型用于文本分类领域都取得了较好的实验效果。然而,基于深度注意力机制的方法在很大程度上会过于的关注某些关键词,造成分类结果错误。
发明内容
本申请提供了一种文本分类模型的训练方法、文本分类方法、装置、电子设备以及存储介质。
根据本申请的第一方面,提供了一种文本分类模型的训练方法,包括:
获取第一样本文本和所述第一样本文本的类别标签;
基于所述类别标签获取所述第一样本文本中的关键词;
确定所述类别标签对应的掩码概率,并根据所述类别标签对应的掩码概率、所述关键词和所述第一样本文本,获取第二样本文本;
根据所述第二样本文本和所述类别标签训练初始的文本分类模型,得到训练好的文本分类模型。
根据本申请的第二方面,提供了一种文本分类方法,包括:
获取待处理文本;
将所述待处理文本输入至预设的文本分类模型,获得所述待处理文本的分类预测结果;
其中,所述文本分类模型为采用如前述第一方面所述的训练方法训练得到的模型。
根据本申请的第三方面,提供了一种文本分类模型的训练装置,包括:
第一获取模块,用于获取第一样本文本和所述第一样本文本的类别标签;
第二获取模块,用于基于所述类别标签获取所述第一样本文本中的关键词;
确定模块,用于确定所述类别标签对应的掩码概率;
第三获取模块,用于根据所述类别标签对应的掩码概率、所述关键词和所述第一样本文本,获取第二样本文本;
训练模块,用于根据所述第二样本文本和所述类别标签训练初始的文本分类模型,得到训练好的文本分类模型。
根据本申请的第四方面,提供了一种文本分类装置,包括:
获取模块,用于获取待处理文本;
预测模块,用于将所述待处理文本输入至预设的文本分类模型,获得所述待处理文本的分类预测结果;
其中,所述文本分类模型为采用如前述第三方面所述的训练装置训练得到的模型。
根据本申请的第五方面,提供了一种电子设备,包括:
至少一个处理器;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310010897.5/2.html,转载请声明来源钻瓜专利网。