[发明专利]基于特征比较的通道注意力机制的细粒度图像识别方法有效
申请号: | 202010877341.2 | 申请日: | 2020-08-27 |
公开(公告)号: | CN111985572B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张靖;贾书坤;赵鑫;白岩 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 比较 通道 注意力 机制 细粒度 图像 识别 方法 | ||
1.一种基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,该细粒度图像识别方法包括:
步骤S10,通过训练好的特征提取网络提取待识别细粒度图像的特征图;所述特征提取网络基于深度卷积神经网络构建;
步骤S20,对所述特征图进行非线性映射,并对每个特征通道的特征进行平均池化,获得基本特征向量xi;其中,i=1,2,…,d为特征通道的标记,d为特征向量的维度;
步骤S30,将所述基本特征向量xi输入训练好的分类器,获取待识别细粒度图像的分类结果;
其中,所述特征提取网络和所述分类器,其训练中引入基于特征比较的通道注意力机制,其训练方法为:
步骤A10,通过特征提取网络提取设定数量的一批训练样本的特征图,并进行非线性映射以及平均池化,获得基本特征向量集;获取所述一批训练样本的样本标签集;
步骤A20,将每一个基本特征向量按照对应的标签划入相应的类别,并分别计算每个类别的平均特征向量;
步骤A30,通过所述基于特征比较的通道注意力机制的特征比较模块进行每一个训练样本的基本特征向量与其所在类别的平均特征向量的比较,并采用符号函数进行编码,获得编码结果集合;通过所述基于特征比较的通道注意力机制的基础注意力权重生成模块计算每一个训练样本对应的基本特征向量的基础注意力权重;所述基础注意力权重生成模块包括两层全连接神经网络;
步骤A40,通过所述基于特征比较的通道注意力机制的权重融合模块将每一个基本特征向量对应的编码结果和基础注意力权重进行融合,并通过设定的单调函数对融合结果进行映射,获得最终的注意力权重;
步骤A50,将所述最终的注意力权重按位赋予其对应的基本特征向量的每个通道,获得加权特征向量集;
步骤A60,将所述加权特征向量集输入分类器,并计算分类器输出结果与对应的样本标签的损失函数值;
步骤A70,通过反向传播方法向所述损失函数值变小的方向更新所述特征提取网络、分类器以及基础注意力权重生成模块的参数,并跳转步骤A10进行迭代训练,直至在验证集上的正确率达到设定阈值或达到设定的训练迭代次数,获得训练好的特征提取网络和分类器。
2.根据权利要求1所述的基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,步骤A20中“分别计算每个类别的平均特征向量”,其方法为:
其中,Nj为属于第j个类别的训练样本数量,Xi为该类别的平均特征向量,d为特征向量的维度,为该类别中第k个训练样本的基本特征向量在第i个通道上的数值。
3.根据权利要求1所述的基于特征比较的通道注意力机制的细粒度图像识别方法,其特征在于,步骤A30中“进行每一个训练样本的基本特征向量与其所在类别的平均特征向量的比较,并采用符号函数进行编码”,其方法为:
si=sign(xi-Xi)
其中,xi和Xi分别为训练样本对应的基本特征向量和平均特征向量,si为通过符号函数对xi和Xi的比较结果进行编码的结果,sign(·)为符号函数,若xi≥Xi,则si=1,若xiXi,则si=-1,i表示第i个通道。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010877341.2/1.html,转载请声明来源钻瓜专利网。