[发明专利]基于表征数据增强和损失再平衡的长尾图像识别方法在审
申请号: | 202310019861.3 | 申请日: | 2023-01-06 |
公开(公告)号: | CN116030302A | 公开(公告)日: | 2023-04-28 |
发明(设计)人: | 杨云;杨鹏;杜飞 | 申请(专利权)人: | 云南大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V40/10 |
代理公司: | 昆明金科智诚知识产权代理事务所(普通合伙) 53216 | 代理人: | 胡亚兰 |
地址: | 650091 云*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 表征 数据 增强 损失 平衡 长尾 图像 识别 方法 | ||
1.基于表征数据增强和损失再平衡的长尾图像识别方法,其特征在于,按照以下步骤进行:
步骤S1,长尾图像预处理:
步骤S2,不同数据集按照不同的不平衡比例进行构造训练集和测试集,在长尾数据分布中训练集的不平衡率为[500,256,100,50,10],利用python分别构造不同比例的训练集,测试集则保持平衡;
步骤S3,构造随机数据增强列表,使用python中的transform工具包构造需要使用的随机增强列表,数据增强列表的顺序为图片随机裁剪、图片随机翻转、改变图像的属性,最后进行归一化;
步骤S4,获得每一个类别的采样权重,通过翻转头部类到尾部类的样本数量加上权重的缩放因子,再将该权重转为一个Tensor向量;其中,计算每个类别的权重表达式如下:
其中,N代表权重的缩放因子,W表示类别的权重;公式(1)计算得出每个类别样本数量占总体样本数量的权重并赋值给a,用于公式(2)计算每个类别的权重;
步骤S5,将权重作为参数使用pytorch工具包构建反采样训练集和加权损失的权重;
步骤S6,建立长尾数据分类模型;
步骤S7,构建一阶段的训练范式,使用双边分支结构自适应地从未加权分支转变到加权分支;训练初始,未加权分支学习长尾图像的特征,随着训练轮次的增加逐渐转移到使用重加权分类分支来学习如何对长尾数据进行分类,从而完成原始数据学习长尾图像的表征和对长尾图像进行识别。
2.根据权利要求1所述的基于表征数据增强和损失再平衡的长尾图像识别方法,其特征在于,所述步骤S1具体为:调用Pytorch工具包,将长尾图像的尺寸大小调整为224×224,调整后的图像进行归一化处理,并作为图像数据集。
3.根据权利要求1所述的基于表征数据增强和损失再平衡的长尾图像识别方法,其特征在于,所述步骤S6具体包括:
S61,运用ResNet作为主干网络,参考对比学习中的内容,在ResNet上增加预测头、对比头;
S62,在构造好的训练集和反采样训练集进行随机两次数据增强,生成四个训练集合;
S63,将训练集的图片及标签和反采样训练集的图片及标签先进行Mix-up数据混合,再将训练集的图片及标签和反采样训练集的图片及标签进行Cut-mix数据混合,最终生成两组使用不同混合类型的两组图像混合样本;
S64,构建自监督学习分支,通过全局图片混合的数据增强Mix-up和局部图片混合的数据增强Cut-mix构造出两组图片,再由特征提取器的映射头分别获得Mix-up增强后的整组图片特征映射hg和Cut-mix增强后的整组图片特征映射hl,然后对比头将hg和hl表示转换为输出ug和ul,最小化它们的负余弦相似性,表达式如下:
其中||·||是L2归一化,hg表示Mix-up增强后的整组图片被特征提取器提取的特征,hl表示Cut-mix增强后的整组图片被特征提取器提取的特征,ug和ul分别表示将特征hg和hl经过线性空间映射后的图片特征;
遵循Sim-Siam的架构,使用停止梯度操作来防止崩溃,SimSiam损失函数定义为:
其中sg(hl)、sg(hg)分别为经过Cut-mix、Mix-up数据混合后再由特征提取器提取特征,将提取特征输入到映射头进行特征映射后的输出;
最终构建了两组使用训练集和反采样集的图片;
在计算未加权分类分支和加权分类分支的损失都基于交叉熵损失,区别在于加权分支的交叉熵使用公式(1)和(2)得出的类别权重加权到交叉熵损失;而未加权分支则仅使用交叉熵计算每个类别的交叉熵损失;因此在计算未加权分类分支的交叉熵损失£c时通过以下公式进行计算::
其中,n表示样本的每一次训练的批量大小,f(·)表示预测概率分别为经过Mix-up和Cut-mix后的第i张图片,分别为经过Mix-up和Cut-mix后的第i张图片的标签概率;
S65,构建类别再平衡分支,引入与标签频率成反比的加权因子,然后强制模型学习尾部类和抑制头部类的学习,权重因子设置为:
其中,ri是训练数据集的第i类的采样频率,k是衡量头部类和尾部类之间差距的超参数,c为总的类别数;
给定一个训练数据集再平衡加权分类分支交叉熵损失可以写成:
其中和分别表示混合图像的预测概率和该图像应加权的权重因子。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南大学,未经云南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310019861.3/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置