[发明专利]自适应步幅卷积的细粒度图像识别方法及系统在审
申请号: | 202111508103.5 | 申请日: | 2021-12-10 |
公开(公告)号: | CN114359711A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 董翔宇;朱涛;刘之奎;徐斓瑛;容圣海;李腾;廖军;罗沙;谢佳;李卫国;黄道均;王子磊;周正;张俊杰;王刘芳;李冀;刘鑫;朱元付;常文婧 | 申请(专利权)人: | 国网安徽省电力有限公司超高压分公司;中国科学技术大学先进技术研究院;国家电网有限公司 |
主分类号: | G06V20/10 | 分类号: | G06V20/10;G06V10/40;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/04;G06N3/08;G06T3/40 |
代理公司: | 北京润平知识产权代理有限公司 11283 | 代理人: | 肖冰滨 |
地址: | 231131 安徽*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 自适应 步幅 卷积 细粒度 图像 识别 方法 系统 | ||
本发明提供一种自适应步幅卷积的细粒度图像识别方法及系统,属于图像识别技术领域。所述识别方法包括:将待分类图像输入注意力图提取器中以得到具有突出判别区域的注意力图,其中,所述注意力图提取器包括卷积神经网络、特征图重塑模块和三线性乘积模块,所述卷积神经网络用于根据所述待分类图像生成对应的特征图,所述特征图重塑模块用于将所述特征图重塑成矩阵,所述三线性乘积模块用于根据所述矩阵生成所述注意力图;采用步幅向量生成器根据所述注意力图生成用于表示卷积核分别沿着x轴和y轴方向上扫描的步幅向量;采用动态步幅卷积模块根据所述步幅向量对所述特征图进行滑窗计算以得到所述识别结果。该识别方法及系统能够提高图像识别的准确性。
技术领域
本发明涉及图像识别技术领域,具体地涉及一种自适应步幅卷积的细粒 度图像识别方法及系统。
背景技术
随着激增的图像数据和深度学习技术的发展,细粒度图像分类技术受到 了越来越多的关注。细粒度图像分类的目的是在一个粗类别进行更加细致的 子类划分。与普通的图像分类不同,细粒度图像具有较小的类间差异和较大 的类内差异,该任务更具挑战性以及研究价值。
在细粒度图像分类任务中,类别之间的差异体现在特定部位的细节上, 这就需要针对这些具有判别性的区域进行特殊处理,提取更具有判别性的特 征。目前的细粒度分类方法主要包括两种方法:一种是传统的强监督分类模 型,其借助标注框来学习具有判别性的局部块的检测,然后提取有判别的特 征,但该方法严重依赖于人工标注信息,这耗费了大量时间和资源。另一种 是基于弱监督的分类方法,仅依赖图像的类别标签,来实现有信息部位的定 位和特征提取。在专利《一种基于块检测器及特征融合的卷积卷积神经网络的细粒度图像识别方法及系统》中,首先通过池化得到局部特征和全局特征, 然后对这些特征用一个块检测器进行过滤,此外构建一个特征融合流对局部 过滤特征和全局过滤特征进行融合,来实现更细节信息的提取。但是这种方 式对细节的差异会进行无差别的特征提取,没有显式地关注到局部区域。在 专利《一种基于特征融合的细粒度图像分类方法》中,利用改进的非极大值 抑制优化区域建议网络生成能定位目标区域的矩形框,然后通过注意力模块 改进双线性卷积网络用于细粒度分类任务,以获取不同维度的注意力特征。在专利《弱监督细粒度物体分类方法》中,对输入图像,通过区域建议网络 生成一系列矩形的局部区域,并将各个区域按照置信度从大到小排序得到前 K个局部区域,并对这些区域提取特征,用于最后的集成预测。然而上述的 通过矩形框分割物体的显著性部位的方法存在一些共同的缺点:
(1)模型难以生成精确的矩形框来定位物体部位;
(2)矩形框的数量一般是一个预先定义的超参数,使得模型不够灵活;
(3)矩形框难以凸显出物体的不规则区域。由于上述方法的不足,影 响了模型对细粒度图像识别的准确度。
发明内容
本发明实施例的目的是提供一种自适应步幅卷积的细粒度图像识别方 法及系统,该识别方法及系统能够提高图像识别的准确性。
为了实现上述目的,本发明实施例提供一种自适应步幅卷积的细粒度图 像识别方法,包括:
将待分类图像输入注意力图提取器中以得到具有突出判别区域的注意 力图,其中,所述注意力图提取器包括卷积神经网络、特征图重塑模块和三 线性乘积模块,所述卷积神经网络用于根据所述待分类图像生成对应的特征 图,所述特征图重塑模块用于将所述特征图重塑成矩阵,所述三线性乘积模 块用于根据所述矩阵生成所述注意力图;
采用步幅向量生成器根据所述注意力图生成用于表示卷积核分别沿着x 轴和y轴方向上扫描的步幅向量;
采用动态步幅卷积模块根据所述步幅向量对所述特征图进行滑窗计算 以得到所述识别结果。
可选地,采用步幅向量生成器根据所述注意力图生成用于表示卷积核分 别沿着x轴和y轴方向上扫描的步幅向量包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网安徽省电力有限公司超高压分公司;中国科学技术大学先进技术研究院;国家电网有限公司,未经国网安徽省电力有限公司超高压分公司;中国科学技术大学先进技术研究院;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111508103.5/2.html,转载请声明来源钻瓜专利网。