[发明专利]基于特征金字塔与全局平均池化的细粒度图像分类方法有效
申请号: | 201910899445.0 | 申请日: | 2019-09-23 |
公开(公告)号: | CN110619369B | 公开(公告)日: | 2020-12-11 |
发明(设计)人: | 龚声蓉;周少雄;王朝晖;应文豪;李菊 | 申请(专利权)人: | 常熟理工学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张俊范 |
地址: | 215500 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 金字塔 全局 平均 细粒度 图像 分类 方法 | ||
1.一种基于特征金字塔与全局平均池化的细粒度图像分类方法,其特征在于,包括以下步骤:
步骤1、图像输入预训练的卷积神经网络的卷积层得到多通道的特征图;
步骤2、所述多通道的特征图经过全局平均池化层,得到输入图像的显著图,提取目标的位置信息;
步骤3、特征金字塔网络提取多通道的特征图的特征并进行预测得到信息量最大的K个局部区域;所述步骤3包括以下步骤:步骤3.1、特征图输入特征金字塔网络生成N种尺度的特征图,N为不小于3的自然数;步骤3.2、将步骤3.1得到的特征图中的上层特征图进行上采样与下层特征图经过卷积核后进行融合,得到N种尺度的融合特征图;步骤3.3、在N种尺度的融合特征图上选取不同大小的候选区,经过步骤2生成的包围盒过滤后进行预测并按照其激活值大小进行排序得到局部区域,所述包围盒是取显著图中的最大连通区域并设定阈值得到目标的具体位置而生成;
步骤4、聚合所述K个局部区域的局部特征和输入图像经过所述卷积神经网络得到的全局特征预测输出最终的识别类别。
2.根据权利要求1所述的基于特征金字塔与全局平均池化的细粒度图像分类方法,其特征在于,所述步骤2包括以下步骤:步骤2.1、全局平均池化层将每个特征图映射为一个神经元,并连接softmax进行训练,预测类别;步骤2.2:训练完成后,将神经元对应的概率最高的类别的权重与所述多通道的特征图分别相乘并累加,得到的显著图。
3.根据权利要求1所述的基于特征金字塔与全局平均池化的细粒度图像分类方法,其特征在于,所述步骤3预测得到信息量最大的K个局部区域采用排序一致损失进行优化,使局部区域分类预测结果与特征金字塔网络得到的激活值大小具有相同的排序。
4.根据权利要求3所述的基于特征金字塔与全局平均池化的细粒度图像分类方法,其特征在于,所述采用排序一致损失进行优化是以铰链损失函数进行优化,设所述K个局部区域为R={R1,R2,...,RK},按激活值从高到低进行排列,所述K个局部区域经过特征金字塔网络预测得到的激活值分别为S={S1,S2,...,SK},所述K个局部区域经过卷积神经网络预测得到的概率为P={P1,P2,...,PK},排序损失的定义如下:
Si和Sj为激活值,
铰链损失函数f(x)为:f(x)=max{1-x,0}。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常熟理工学院,未经常熟理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910899445.0/1.html,转载请声明来源钻瓜专利网。