[发明专利]一种基于深度卷积神经网络的大规模图像检索方法及系统在审
申请号: | 202210393416.9 | 申请日: | 2022-04-14 |
公开(公告)号: | CN114780767A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 王中元;裴盈娇;陈何玲;何政;邵振峰;邹华;肖进胜 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F16/532 | 分类号: | G06F16/532;G06F16/51;G06F16/55;G06F16/583;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 肖明洲 |
地址: | 430072 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 卷积 神经网络 大规模 图像 检索 方法 系统 | ||
1.一种基于深度卷积神经网络的大规模图像检索方法,其特征在于,包括以下步骤:
步骤1:将待查询图像输入到深度卷积神经网络中生成哈希码queryHash,以及权重queryWeight;
所述深度卷积神经网络,由基于ResNet50的特征提取层、分类层、哈希层以及权重层四部分组成;
所述基于ResNet50的特征提取层,由依次连接的去除平均池化和全连接层后的ResNet50、CSA的特征细化层和全局平均池化层组成;
所述分类层、哈希层,分别是两个全连接层,并列设置在全局平均池化层之后,在对应的损失函数的监督下,分别预测图像标签和哈希码;
所述权重层,设置在哈希层之后,为每一个哈希码产生对应的权重;
步骤2:计算查询图像和现有图像数据库中图像哈希码的相似度,取相似度最高的图像作为检索结果;
其中,现有图像数据库中的检索图像入库时随即输入到深度卷积神经网络中生成哈希码databaseHash作为特征索引保存在图像数据库中以供检索;
若深度卷积神经网络生成的是64位的哈希码,但需要更短长度的哈希码时,则直接根据查询权重queryWeight,从当前得到的长哈希码中按权重大小从高到低选取相应的哈希位来获取低位哈希码。
2.根据权利要求1所述的基于深度卷积神经网络的大规模图像检索方法,其特征在于:所述深度卷积神经网络,基于Resnet50的特征提取层第一部分为resnet的特征提取层,由一个独立卷积层和4个卷积残差结构组成,每个残差块中包含若干卷积层,每一层卷积操作后都要经过BatchNorm正则化和Relu激活函数调整特征分布;特征提取层输出维度为2048的特征向量,然后经过一个卷积核大小为3、步长为1的卷积层对特征降维到原来的四分之一;接下来通过CSA的特征细化层加强网络对重要特征的关注度,增强特征图的语义信息;然后将增强后的特征向量通过一个卷积层降维之后再通过全局平均池化操作进行空间上的压缩;最后分别通过输出维度为哈希码长度的两个全连接层分别预测哈希码和分类信息;哈希层后还接入了一个同样输出维度的全连接层,用于产生哈希码对应的自适应权重;哈希层输出的向量要再经过一个tan-like激活函数来对哈希码进行收敛。
3.根据权利要求1所述的基于深度卷积神经网络的大规模图像检索方法,其特征在于:所述深度卷积神经网络的权重层,输入为哈希层输出的哈希码输出为哈希码的注意力图即权重向量其中,哈希码H是由C个通道组成且每个通道只包含一个元素的特征图;表示通道为C,长和宽分别为1的特征图;在权重层中,首先对W和W的转置进行矩阵乘法,然后应用softmax层,得到通道注意力映射每一个元素xji代表第i个通道对第j个通道的影响;最后,对注意力图在纵向维度上求和以得到每一个通道对其它通道的总影响以此代表对应哈希位的重要性,再对X′转置得权重向量W;
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210393416.9/1.html,转载请声明来源钻瓜专利网。