[发明专利]训练多标签分类模型的方法及相关产品有效
申请号: | 202211197000.6 | 申请日: | 2022-09-29 |
公开(公告)号: | CN115272780B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 贺婉佶;史晓宇;和超 | 申请(专利权)人: | 北京鹰瞳科技发展股份有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774 |
代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 杜丹丹;陈姗姗 |
地址: | 100081 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 训练 标签 分类 模型 方法 相关 产品 | ||
1.一种训练多标签分类模型的方法,其特征在于,包括:
获取待作为多标签分类模型的训练样本的第一图片集,其中所述多标签分类模型是基于第二图片集预训练好的基础模型,所述第二图片集中的图片具有N个类别标签,所述第一图片集中的图片具有M个类别标签且缺失N-M个类别标注,其中M<N;
基于所述第一图片集和所述第二图片集创建新图片集,其中所述新图片集中缺失部分类别标注的图片配置有基于所述多标签分类模型所确定的N-M个软标签,以基于所述软标签标注图片所缺失的类别,其中基于所述多标签分类模型对来自所述第一图片集的图片的未标注类别进行类别预测,并根据类别预测的结果确定所述未标注类别对应的N-M个软标签;以及
基于所述新图片集对所述多标签分类模型进行微调训练。
2.根据权利要求1所述的方法,其特征在于,基于所述第一图片集和所述第二图片集创建新图片集包括:
对所述第一图片集和所述第二图片集进行合并处理,以得到所述新图片集,其中所述新图片集中的图片包括所述第一图片集中的所有图片和所述第二图片集中的所有图片。
3.根据权利要求2所述的方法,其特征在于,还包括:
基于所述新图片集中图片的来源确定作为训练样本的图片具有的类别标签。
4.根据权利要求3所述的方法,其特征在于,基于所述新图片集中图片的来源确定作为训练样本的图片具有的类别标签包括:
响应于确定所述新图片集中作为训练样本的图片来源于所述第二图片集,将所述第二图片集对应的N个类别标签确定为所述作为训练样本的图片的类别标签;或者
响应于确定所述新图片集中作为训练样本的图片来源于所述第一图片集,将所述第一图片集对应的M个类别标签和N-M个软标签确定为所述作为训练样本的图片的类别标签。
5.根据权利要求1所述的方法,其特征在于,基于所述多标签分类模型对来自所述第一图片集的图片的未标注类别进行类别预测包括:
基于所述多标签分类模型预测来自所述第一图片集的图片的未标注类别对应的类别概率值,且确定所述类别概率值为所述类别预测的结果。
6.根据权利要求5所述的方法,其特征在于,基于所述新图片集对所述多标签分类模型进行微调训练包括:
以所述新图片集中的图片为监督信号对所述多标签分类模型进行有监督微调训练,其中,训练过程中以目标激活函数为所述多标签分类模型的最后一层,且以交叉熵为所述多标签分类模型的损失函数。
7.根据权利要求6所述的方法,其特征在于,还包括:
在利用来自所述第一图片集的图片微调所述多标签分类模型时,根据作为训练样本的图片的未标注类别对应的类别概率值确定交叉熵的目标。
8.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其存储有训练多标签分类模型的计算机指令,当所述计算机指令由所述处理器运行时,使得所述电子设备执行根据权利要求1-7的任意一项所述的方法。
9.一种计算机可读存储介质,其特征在于,包含训练多标签分类模型的计算机指令,当所述计算机指令由处理器执行时,使得实现根据权利要求1-7的任意一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京鹰瞳科技发展股份有限公司,未经北京鹰瞳科技发展股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211197000.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钢管淬火装置
- 下一篇:一种固废基3D打印材料