[发明专利]一种基于离散梯度反向传播的图像检索方法有效
申请号: | 201910974197.1 | 申请日: | 2019-10-14 |
公开(公告)号: | CN110795591B | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 苏勤亮;黄晓娜 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F16/583 | 分类号: | G06F16/583;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 离散 梯度 反向 传播 图像 检索 方法 | ||
本发明提供一种基于离散梯度反向传播的图像检索方法,该方法解决了深度特征学习和二进制哈希编码端到端框架中存在的病态梯度问题。针对深度网络非凸优化中存在的病态梯度问题,利用离散梯度反向传播对非光滑激活的深度网络进行梯度估计,将其转化为一个可以反向传播训练的深度神经网络。通过在训练过程中引入离散变量的梯度估计量,使优化过程中准确学习二进制哈希码成为可能。
技术领域
本发明涉及图像处理算法技术领域,更具体地,涉及一种基于离散梯度反向传播的图像检索方法。
背景技术
近年来,每天都有成千上万的图片上传到互联网上,这使得根据不同用户的要求寻找相关图片变得极其困难。例如,基于内容的图像检索是检索与给定查询图像相似的图像,其中“相似”可以指视觉上相似或语义上相似。假设数据库中的图像和查询图像都用实值特征表示,查找相关图像的最简单方法是根据数据库图像到查询的距离对它们进行排序。与传统的索引方法并行的一个优势解决方案是哈希方法,它将对象的高维特征映射到汉明空间中,生成一个低维的哈希码来表示一个对象,并为相似的数据项生成相似的哈希码。
许多哈希方法已经被提出,通过对紧凑的哈希码进行汉明排序来实现高效的近似最近邻(ANN)搜索。深度学习哈希方法表明,利用深度神经网络可以更有效地对特征表示和哈希编码进行端到端的学习,这些深度学习哈希方法在许多基准测试中显示了最先进的性能。要使深度学习真正实现端到端哈希,有两个关键挑战。首先,将本质上连续的深度表示转换为精确的二进制哈希码,需要使用符号函数h=sgn(z)作为激活函数,然而,对于所有非零输入,符号函数的梯度为零,这使得标准的反向传播不可行的。这就是病态梯度问题,它是利用反向传播训练深度神经网络的关键难点。因此许多深度学习哈希方法的做法是,它们首先学习图像连续的深度表示,然后利用构造好的哈希函数将图像特征映射为哈希码。即把图像特征提取和哈希码的构造过程分为完全独立的两个过程,使得检索准确率低。
发明内容
本发明提供一种基于离散梯度反向传播的图像检索方法,该算法可解决深度特征学习和二进制哈希编码端到端框架中存在的病态梯度问题。
为了达到上述技术效果,本发明的技术方案如下:
一种基于离散梯度反向传播的图像检索方法,包括以下步骤:
S1:将图像数据的语义相似度矩阵S;
S2:构建卷积神经网络架构,卷积神经网络架构包含卷积子网络、全连接层、阈值化层、损失层,卷积子网络中的每个卷积层后都加一个最大池化层;
S3:利用训练样本集对神经网络进行训练,在训练过程中,用梯度估计量估计神经网络中量化过程中不可求导的梯度值;
S4:在测试过程中,从测试样本集选择一张查询图像xv,通过深度神经网络得到其对应的编码bv;使用公式dvi=bv,bi计算查询样本到训练集的第i个样本的汉明距离,先对计算得到的汉明距离按照从小到大的顺序进行排序,最后,将距离最小的前K个图像特征对应的图像作为检索结果返回。
进一步地,所述步骤S1的具体过程是:
将图像数据集中的部分图像作为训练样本集,剩下的图像作为测试样本集,根据训练样本集和测试样本集中图像的标签信息,构建出图像间的语义相似度矩阵S。
进一步地,所述步骤S2的具体过程是:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910974197.1/2.html,转载请声明来源钻瓜专利网。