[发明专利]训练多标签分类模型的方法及相关产品有效

申请号：	202211197000.6	申请日：	2022-09-29
公开（公告）号：	CN115272780B	公开（公告）日：	2022-12-23
发明（设计）人：	贺婉佶;史晓宇;和超	申请（专利权）人：	北京鹰瞳科技发展股份有限公司
主分类号：	G06V10/764	分类号：	G06V10/764;G06V10/774
代理公司：	北京维昊知识产权代理事务所(普通合伙) 11804	代理人：	杜丹丹;陈姗姗
地址：	100081 北京市海***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	训练标签分类模型方法相关产品
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种训练多标签分类模型的方法，其特征在于，包括：

获取待作为多标签分类模型的训练样本的第一图片集，其中所述多标签分类模型是基于第二图片集预训练好的基础模型，所述第二图片集中的图片具有N个类别标签，所述第一图片集中的图片具有M个类别标签且缺失N-M个类别标注，其中M＜N；

基于所述第一图片集和所述第二图片集创建新图片集，其中所述新图片集中缺失部分类别标注的图片配置有基于所述多标签分类模型所确定的N-M个软标签，以基于所述软标签标注图片所缺失的类别，其中基于所述多标签分类模型对来自所述第一图片集的图片的未标注类别进行类别预测，并根据类别预测的结果确定所述未标注类别对应的N-M个软标签；以及

基于所述新图片集对所述多标签分类模型进行微调训练。

2.根据权利要求1所述的方法，其特征在于，基于所述第一图片集和所述第二图片集创建新图片集包括：

对所述第一图片集和所述第二图片集进行合并处理，以得到所述新图片集，其中所述新图片集中的图片包括所述第一图片集中的所有图片和所述第二图片集中的所有图片。

3.根据权利要求2所述的方法，其特征在于，还包括：

基于所述新图片集中图片的来源确定作为训练样本的图片具有的类别标签。

4.根据权利要求3所述的方法，其特征在于，基于所述新图片集中图片的来源确定作为训练样本的图片具有的类别标签包括：

响应于确定所述新图片集中作为训练样本的图片来源于所述第二图片集，将所述第二图片集对应的N个类别标签确定为所述作为训练样本的图片的类别标签；或者

响应于确定所述新图片集中作为训练样本的图片来源于所述第一图片集，将所述第一图片集对应的M个类别标签和N-M个软标签确定为所述作为训练样本的图片的类别标签。

5.根据权利要求1所述的方法，其特征在于，基于所述多标签分类模型对来自所述第一图片集的图片的未标注类别进行类别预测包括：

基于所述多标签分类模型预测来自所述第一图片集的图片的未标注类别对应的类别概率值，且确定所述类别概率值为所述类别预测的结果。

6.根据权利要求5所述的方法，其特征在于，基于所述新图片集对所述多标签分类模型进行微调训练包括：

以所述新图片集中的图片为监督信号对所述多标签分类模型进行有监督微调训练，其中，训练过程中以目标激活函数为所述多标签分类模型的最后一层，且以交叉熵为所述多标签分类模型的损失函数。