[发明专利]文本模型再训练的方法、装置、设备及存储介质在审
申请号: | 202110587698.1 | 申请日: | 2021-05-27 |
公开(公告)号: | CN113360644A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 黄海龙 | 申请(专利权)人: | 中国平安人寿保险股份有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35;G06K9/62 |
代理公司: | 深圳市明日今典知识产权代理事务所(普通合伙) 44343 | 代理人: | 王杰辉;熊成龙 |
地址: | 518000 广东省深圳市福田区福田街道益田路5033号平安*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文本 模型 训练 方法 装置 设备 存储 介质 | ||
1.一种文本模型再训练的方法,其特征在于,包括:
获取训练后的文本模型,对无标数据集合中的每个无标数据进行弱标注,并获取各所述弱标注的依据信息;其中,所述依据信息为无标数据在所述训练后的文本模型中的各预设类别的概率分布;
根据所述依据信息计算每一个所述弱标注的第一预测置信度;
判断所述第一预测置信度是否大于预设置信度值;
从各所述弱标注中提取大于所述预设置信度值的目标弱标注,并计算所述目标弱标注的损失值,以及根据所述依据信息拟合各个所述目标弱标注对应的所述无标数据的目标标签;
将所述目标标签作为所述目标弱标注对应的所述无标数据的输出,将所述无标数据集合作为所述文本模型的输入,并根据所述损失值调整所述文本模型中的参数,以对所述文本模型再训练。
2.如权利要求1所述的文本模型再训练的方法,其特征在于,所述根据所述依据信息计算每一个所述弱标注的第一预测置信度的步骤,包括:
从所述依据信息中提取所述无标数据在所述文本模型中各个类别的概率;
根据公式计算所述第一预测置信度;其中,E表示所述第一预测置信度,pi表示第i个所述无标数据在所述文本模型中对应弱标注的概率,n表示所述无标数据集合的无标数据数量。
3.如权利要求1所述的文本模型再训练的方法,其特征在于,所述计算所述目标弱标注的损失值的步骤,包括:
获取所述无标数据集合中每个所述目标弱标注对应的所述无标数据的数据向量;
根据所述数据向量计算每两个所述数据向量之间的欧式距离;
根据所述欧式距离以及公式计算所述损失值,其中dij表示第i个无标数据和第j个无标数据对应数据向量之间的欧式距离,Vi表示第i个数据对应的数据向量,Vj表示第j个数据对应的数据向量,γ为常数,max(0,γ-dij)表示两者之间的最大值。
4.如权利要求1所述的文本模型再训练的方法,其特征在于,所述将所述目标标签作为所述目标弱标注对应的所述无标数据的输出,将所述无标数据集合作为所述文本模型的输入,并根据所述损失值调整所述文本模型中的参数,以对所述文本模型再训练的步骤之后,还包括:
根据再训练后的所述文本模型对所述无标数据集合进行弱标注,并获取当前所述文本模型进行弱标注的依据信息;
根据当前所述文本模型进行弱标注的依据信息计算所述弱标注的第二预测置信度;
判断所述第二预测置信度是否大于预设置信度值;
若所述第二预测置信度不大于所述预设置信度值,则判定所述文本模型再训练完成。
5.如权利要求1所述的文本模型再训练的方法,其特征在于,所述根据所述依据信息拟合各个所述目标弱标注对应的所述无标数据的目标标签的步骤,包括:
从所述依据信息中,获取所述无标数据集合中每个所述无标数据的概率分布;
将各所述无标数据对应的概率分布输入至公式中,得到各所述无标数据对应的目标标签;其中,表示第i个无标数据对应的目标标签,[f(x;θ]ij表示模型第i个无标数据在第t类的概率,其中,β为所述无标数据集合,表示所述无标数据集合中的一个无标数据。
6.如权利要求1所述的文本模型再训练的方法,其特征在于,所述对无标数据集合中的每个无标数据进行弱标注的步骤,包括:
通过预测模型预测预设词库中的各个词替换各所述无标数据的概率;
根据所述概率,选取第一预设个数的目标词汇;
检测各个类别的预设词典中与所述目标词汇的重合个数;
将所述重合个数大于第二预设个数对应的目标类别作为所述无标数据的弱标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安人寿保险股份有限公司,未经中国平安人寿保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110587698.1/1.html,转载请声明来源钻瓜专利网。