[发明专利]一种细粒度图像识别分类模型训练方法、装置及设备有效
申请号: | 202310140142.7 | 申请日: | 2023-02-21 |
公开(公告)号: | CN115830402B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 余鹰;王景辉 | 申请(专利权)人: | 华东交通大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/26 |
代理公司: | 南昌旭瑞知识产权代理事务所(普通合伙) 36150 | 代理人: | 曹远龙 |
地址: | 330000 江西省南*** | 国省代码: | 江西;36 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 细粒度 图像 识别 分类 模型 训练 方法 装置 设备 | ||
1.一种细粒度图像识别分类模型训练方法,其特征在于,所述方法包括:
获取模型训练用的细粒度图像,并将所述细粒度图像输入到预设网络模型当中进行训练,所述预设网络模型包括多层自注意力层以及多尺度模块,每一所述自注意力层分别与所述多尺度模块连接,所述细粒度图像依次经过每一所述自注意力层,以通过所述自注意力层对所述细粒度图像进行分类向量学习;
获取预设数量个目标自注意力层对所述细粒度图像进行学习得到的分类向量,所述目标自注意力层位于所述多层自注意力层的后端;
将每个所述目标自注意力层的分类向量输入到预设分类器当中,输出每个所述目标自注意力层的分类标签,分别将每个所述目标自注意力层的分类标签与预设真实标签进行损失计算,得到每个所述目标自注意力层的损失值;
根据每个所述目标自注意力层的损失值,分别通过反向传播机制更新网络参数,以训练所述细粒度图像识别分类模型;
此外,所述方法还包括:
根据预设计算规则计算出所述自注意力层在对所述细粒度图像进行分类向量学习之后的最终注意力权重矩阵;
根据所述最终自注意力权重矩阵确定分类目标所在位置,并根据所述分类目标所在位置在所述细粒度图像中截取分类目标区域图像;
将所述分类目标区域图像缩放到与所述细粒度图像同样大小后输入到所述预设网络模型当中进行训练,以强化训练所述细粒度图像识别分类模型;
其中,所述预设网络模型还包括线性投影层和位置编码层,将所述细粒度图像输入到预设网络模型当中进行训练的步骤包括:
按照预设分割规则将所述细粒度图像分割成预设份子图像,并通过所述线性投影层将每一所述子图像映射到高维特征空间,得到每份所述子图像的图片向量;
通过所述位置编码层对每份所述子图像的图片向量进行编码,以为每个所述图片向量添加位置编码信息,并在第一个图片向量前添加一个空的分类向量,得到向量序列,所述位置编码信息为子图像在整个细粒度图像的位置坐标信息或子图像的编号;
将所述向量序列输入到所述多层自注意力层进行分类向量学习,每层所述自注意力层学习到的分类特征会更新于所述向量序列的分类向量当中,得到每层所述自注意力层的分类向量;
其中,所述自注意力层包括多个注意力头,根据预设计算规则计算出所述自注意力层在对所述细粒度图像进行分类向量学习之后的最终注意力权重矩阵的步骤包括:
在对所述细粒度图像进行分类向量学习之后,在每个所述注意力头当中,分别计算出本层当中分类向量与每个图片向量的注意力权重,得到每个所述注意力头对应的注意力权重矩阵;
将所有所述注意力头的注意力权重矩阵进行点乘计算,得到所述最终注意力权重矩阵;
其中,根据所述最终自注意力权重矩阵确定分类目标所在位置的步骤包括:
计算所述最终注意力权重矩阵中所有注意力权重的平均值;
将所述最终注意力权重矩阵中的每个注意力权重与所述平均值进行比较,大于所述平均值的注意力权重标记为第一阈值,否则标记为第二阈值;
根据与分类向量的注意力权重为第一阈值的目标图片向量的位置编码信息,确定所述分类目标所在位置。
2.根据权利要求1所述的细粒度图像识别分类模型训练方法,其特征在于,注意力权重的计算公式为:
式中,为第
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东交通大学,未经华东交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310140142.7/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序