[发明专利]一种快速优化深度哈希图像编码方法及目标图像检索方法有效
申请号: | 201910701690.6 | 申请日: | 2019-07-31 |
公开(公告)号: | CN110457503B | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 张超;苏树鹏;韩凯;田永鸿 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06N3/04;G06N3/08;G06T9/00 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 优化 深度 希图 编码 方法 目标 图像 检索 | ||
本发明公布了一种快速优化深度哈希图像编码方法及目标图像检索方法,基于贪心策略,针对大型图像数据集,建立哈希图像编码模型,通过优化后得到的深度哈希编码网络生成所有图像的二值编码。在进行目标图像检索时,可通过计算查询图像编码和数据库图像编码之间的汉明距离,迅速得到查询图像的同类相似图像。本发明方法结合神经网络更好地解决了梯度消失和量化误差问题,编码性能更优;用更少的迭代次数完成深度网络的训练过程,训练速度更快;能应用于各种带离散约束的问题,应用范围更广;进一步提高深度神经网络的优化速度和所生成图像编码的检索性能,有效提高了大型图像数据库的检索精度。
技术领域
本发明属于信息检索技术领域,涉及图像处理与图像快速检索技术,尤其涉及一种基于贪心策略的快速优化深度哈希图像编码方法及其目标图像检索方法。
背景技术
随着大数据时代的到来,各领域的数据呈爆发式增长,在如此之大的数据浪潮中,如何检索出自己需要的信息成为了一个重要且紧急的研究课题。哈希算法就是一种针对在大型图像数据集上快速完成目标图像检索的算法,其主要思想是将图像都编码成一串二值码(即每幅图像都用一串有限位的二值码来作为该图像的特征表示),通过二值码之间快速的异或操作得到其汉明距离,从而排序后完成近似最近邻图像检索(即从图像数据库中找出和查询图像最相近的图像)。这种二值图像特征的表示方式能带来非常低的存储要求(二进制)以及非常快的检索速度(通过计算机中最简单的逐位异或操作即可得特征间汉明距离从而判断两张图像的相似程度),因此具备很大的研究潜力和应用范围。
近几年深度学习特别是其代表作——卷积神经网络的快速发展,使得各大与图像相关的应用在性能上得到了质的提升(如分类、物体检测、图像检索等)。深度神经网络主要应用随机梯度下降法进行训练,简而言之,就是通过输入图像到网络,网络正向传播后得到图像特征,计算相应的损失函数(也可称为目标函数,如检索的目标是同一类的图像应该具有相近的图像特征),再将损失反向传播,计算各层神经元的梯度(得到朝着减少损失函数的方向),从而完成参数更新和网络训练,使损失函数降到最低(如图1所示)。深度学习之强大促使哈希研究人员提出将哈希算法和深度网络结合,即深度哈希算法,进一步提高图像编码的检索性能。
深度哈希算法解决快速图像检索任务的思路分两步,一是利用卷积神经网络强大的特征学习能力,去学习图像数据库中各张图像的深度特征表达,以求相对于用原图各像素值或用传统特征提取算法提取的特征作为图像的表示,深度网络能输出更能表征输入图像特点的图像特征。二是利用哈希算法将上述连续值图像特征进一步编码为二进制特征,从而极大地降低了存储要求和迅速提高检索效率,真正达到了快速且准确的检索需求。深度哈希算法通过有效地融合上述两个步骤到同一个深度网络框架,使深度特征学习和哈希编码两部分能相互促进学习和训练,从而得到最优的图像二值编码及相应编码网络。
但是,实际上要实现真正网络端到端训练的深度哈希算法依然是个极具挑战性的问题,主要难点在将图像编码成二值码所用到的符号函数(如图2所示),其梯度(导数)处处为零,这对于用梯度下降法进行训练的深度神经网络是致命的,在符号函数前层的网络无法得到任何梯度更新信息而导致训练失败。
哈希算法通过将图像编码成一串紧凑的二值码,从而能在大型图像数据集上快速完成目标图像检索的任务(即给定一张查询图像,算法在大型图像数据库中找出相似的同类图像并返回给用户),具备非常广泛的应用范围——如以图搜图、人脸认证等技术应用。而深度哈希算法则希望结合当下强大的深度学习和哈希算法两者,进一步提高图像检索系统的性能。深度哈希研究领域面临的一个很棘手的问题是,将图像编码成二值码所用到的符号函数(输入大于0的值输出+1,输入小于0的值输出-1),其梯度处处为零,这对于用梯度下降法进行训练的深度神经网络是致命的,这种梯度消失问题会使得网络前层无法得到任何更新信息,最终训练失败从而图像得不到有效的编码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910701690.6/2.html,转载请声明来源钻瓜专利网。