[发明专利]分类神经网络的训练方法、文本分类方法、装置及设备有效
申请号: | 202010244144.7 | 申请日: | 2020-03-31 |
公开(公告)号: | CN111461304B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 徐泽宇;孟二利;孙磊 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/09;G06F16/35 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 康莹 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 神经网络 训练 方法 文本 装置 设备 | ||
本公开是关于一种分类神经网络的训练方法、文本分类方法、装置及设备,所述分类神经网络的训练方法,包括基于以下步骤训练目标神经网络:获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;将所述样本文本数据和对应的回归结果输入至第二目标神经网络;根据第二目标神经网络获得每个所述样本文本数据的预测分类结果;根据每个样本文本数据的预测分类结果与对应类别真实值的差异对所述第二目标卷积神经网络的参数进行调整;在网络损失的变化满足收敛条件后,得到完成训练的第二目标神经网络。本公开可以实现更好的训练第二目标神经网络,提高后续进行文本数据分类的准确性。
技术领域
本公开涉及数据处理技术领域,尤其涉及一种分类神经网络的训练方法、文本分类方法、装置及设备。
背景技术
相关技术中可以基于神经网络来实现文本分类,然而其需要遵循一个基本假设,即类别之间基本没有关联。这就导致对于一种类别之间有趋势关系的数据,比如“优、良、差”,不能实现准确的分类;另一方面,相关技术中的分类方案假设分类问题的数据之间是平等的,即不会关注某一部分数据的对错,只确保整体准确率高即可,这就会导致某些关键数据的分类准确性较低。
发明内容
为克服相关技术中存在的问题,本公开实施例提供一种分类神经网络的训练方法、文本分类方法、装置及设备,用以解决相关技术中的缺陷。
根据本公开实施例的第一方面,提供一种分类神经网络的训练方法,包括基于以下步骤训练目标神经网络:
获取样本文本数据的回归结果,所述回归结果基于预先构建的第一目标神经网络确定,用于表征所述样本文本数据的分类趋势;
将所述样本文本数据和对应的回归结果输入至第二目标神经网络;
根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果;
根据每个所述样本文本数据的预测分类结果与对应类别真实值的差异对所述第二目标卷积神经网络的参数进行调整;
在网络损失的变化满足收敛条件后,得到完成训练的第二目标神经网络。
在一实施例中,所述将所述样本文本数据和对应的回归结果输入至第二目标神经网络,包括:
将所述样本文本数据输入至第二目标神经网络,得到样本文本向量;
将所述样本文件数据对应的回归结果作为所述样本文本向量的新增维度,与所述样本文本向量进行拼接,生成新的样本文本向量;
所述根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果,包括:
基于所述新的样本文本向量,根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果。
在一实施例中,所述将所述样本文本数据和对应的回归结果输入至第二目标神经网络,包括:
确定对应回归结果为目标回归结果的第一样本文本数据;
增大所述第一样本文本数据在训练过程中的权重,以增加所述第一样本文本数据的损失对整体损失的影响;
所述根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果,包括:
基于增大所述第一样本文本数据权重后的样本文本数据,根据所述第二目标神经网络获得每个所述样本文本数据的预测分类结果。
在一实施例中,所述方法还包括基于以下步骤训练所述第一目标神经网络:
将所述样本文本数据输入至所述第一目标神经网络,所述样本数据标注有回归结果的真实值;
根据所述第一目标神经网络得到所述样本文本数据的回归结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010244144.7/2.html,转载请声明来源钻瓜专利网。