[发明专利]文本分类模型的训练方法、装置、计算机设备及介质在审
申请号: | 202211082544.8 | 申请日: | 2022-09-06 |
公开(公告)号: | CN115344699A | 公开(公告)日: | 2022-11-15 |
发明(设计)人: | 黄海龙 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06F40/126;G06F40/284;G06K9/62;G06N3/08 |
代理公司: | 深圳众鼎专利商标代理事务所(普通合伙) 44325 | 代理人: | 姚章国 |
地址: | 518000 广东省深圳市福田区益田路5033号*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 分类 模型 训练 方法 装置 计算机 设备 介质 | ||
1.一种文本分类模型的训练方法,其特征在于,所述文本分类模型的训练方法包括:
获取已知实际类别的文本样本,对所述文本样本中的至少两个词项进行编码,得到对应词项的词编码向量;
将所有词项的词编码向量进行拼接,得到所述文本样本的文本编码向量;
将所述文本编码向量输入至训练好的词项类别概率预测模型,得到所述文本编码向量中各个词项对应的词项类别概率向量,将所有词项类别概率向量进行拼接,得到文本平滑向量;
根据预设的融合系数对所述文本编码向量和所述文本平滑向量进行融合操作,得到文本混合向量;
将所述文本编码向量和所述文本混合向量输入至文本分类模型,得到所述文本样本的预测类别,根据所述预测类别和所述实际类别对所述文本分类模型进行训练,得到训练好的文本分类模型。
2.根据权利要求1所述的文本分类模型的训练方法,其特征在于,所述对所述文本样本中的至少两个词项进行编码,得到对应词项的词编码向量,包括:
对所述文本样本进行分词处理,得到所述文本样本中的N个词项,其中,N为大于2的整数;
对各个所述词项进行编码,得到各个所述词项的词编码向量。
3.根据权利要求1所述的文本分类模型的训练方法,其特征在于,所述将所有词项的词编码向量进行拼接,得到所述文本样本的文本编码向量,包括:
根据N个所述词项在所述文本样本中的顺序,对对应的N个所述词编码向量进行排序;
按照排序结果将N个所述词编码向量拼接成预设维度的文本编码向量。
4.根据权利要求1所述的文本分类模型的训练方法,其特征在于,所述词项类别概率预测模型包括第一编码器和第一解码器,以所述文本编码向量为训练样本,以所述文本样本为训练标签;
所述词项类别概率预测模型的训练过程包括:
将所述文本编码向量输入至所述第一编码器进行特征提取,得到第一文本编码特征;
将所述第一文本编码特征输入至所述第一解码器,得到所述文本编码向量中各个所述词项的词项类别概率向量;
确定所有词项类别概率向量构成的向量为所述文本平滑向量,采用归一化指数函数对所述文本平滑向量中的进行处理,得到预测样本;
根据所述预测样本和对应所述文本样本计算第一损失函数,根据梯度下降法反向修正所述第一编码器和所述第一解码器的参数,直至所述第一损失函数收敛,得到训练好的词项类别概率预测模型。
5.根据权利要求1所述的文本分类模型的训练方法,其特征在于,所述根据预设的融合系数对所述文本编码向量和所述文本平滑向量进行融合操作,得到文本混合向量,包括:
根据所述文本编码向量中各个编码向量值的向量坐标,以及所述文本平滑向量中各个平滑向量值的向量坐标,确定具有相同向量坐标的所述编码向量值和所述平滑向量值;
根据各个所述编码向量值、各个所述编码向量值的第一预设融合系数,以及与各个所述编码向量值具有相同向量坐标的所述平滑向量值、所述平滑向量值的第二预设融合系数,计算融合向量值;
根据各个所述融合向量值和各个所述融合向量值的向量坐标,得到文本混合向量;所述融合向量值的向量坐标为所述编码向量值和平滑向量值之间具有的所述相同向量坐标。
6.根据权利要求1所述的文本分类模型的训练方法,其特征在于,所述文本分类模型包括第二编码器、第三编码器和全连接层,以所述文本编码向量和所述文本混合向量为训练样本,以训练样本的实际类别为训练标签,对所述文本分类模型进行训练,得到训练好的文本分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211082544.8/1.html,转载请声明来源钻瓜专利网。