[发明专利]一种基于余弦度量的深度哈希图像检索方法有效
申请号: | 201910450067.8 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110309333B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 毋立芳;李丰;简萌;胡文进;赵宽;陈禹锟 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06F16/55 | 分类号: | G06F16/55;G06F16/901;G06N3/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 刘萍 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 余弦 度量 深度 希图 检索 方法 | ||
本发明提出了一种基于余弦度量的深度哈希图像检索方法。面对互联网上庞大的图片数据,为了满足用户的需求,找到一种快速且准确的图像检索方法成为了一个亟待解决的问题。基于余弦度量可以有效减少矢量长度的多样性进而提升检索性能,同时在损失函数中引入类别信息,它与余弦度量约束相结合,有助于共同学习同一网络中的相似性保持,也能充分利用分类信息。采用该方案可以有效的实现大规模图像检索,并且经过实验证明,本方案的性能优于目前现有的图像检索方法,具有很重要的应用价值。
技术领域
本发明涉及图像检索领域,具体涉及于一种基于余弦度量的深度哈希图像检索方法。
背景技术
近年来,随着网络多媒体数据爆发式增长,每天都有数十万张图像上传到互联网,面对如此大规模的多媒体数据,想要根据不同的用户需求去在海量图片中检索相关图像变得极为困难。因此,基于内容的图像检索在商业应用和学术领域越来越受到人们的关注。假设数据库中的图像和查询图像都是由实值特征表示,那么最简单的检索相关图像的方法是根据特征空间中数据库图像与查询图像的逐一距离度量来对数据库中的图像进行排序,然后返回距离最小的图像结果。然而,对于如今很常见的具有数百万图像的数据库,采用此种方法会花费大量的时间和内存,并不能满足用户的实时要求。
为了保证检索质量和计算效率的平衡,近似最近邻搜索(ANN:approximatednearest neighbor search)受到了越来越多的学者关注,其被证明足以用于许多实际问题,因此吸引了大量的研究工作。而哈希技术作为ANN的分支,其目标是把高维数据编码成紧凑的二进制数据的同时保持高维数据和二进制数据度量结构的相似性。由于其计算效率高和存储空间小的优点而被广大ANN研究者所关注。目前哈希算法主要分为:无监督哈希方法和有监督哈希方法。
无监督哈希方法是不需要任何训练数据来学习哈希函数或哈希编码。其中代表性的有:局部敏感性哈希(LSH)、谱哈希(SH)、迭代量化哈希(ITQ)等,这些方法由于没有利用任何训练数据样本,因此没有利用任何语义信息,所以很难达到令人满意的检索性能。而有监督哈希方法在训练过程中利用监督信息来直接引导哈希函数学习,因为利用了语义信息,所以在实际应用过程中,有监督哈希方法表现出更加优异的性能,传统有监督哈希比较有代表性的方法有:基于核函数的监督哈希(KSH)、最小损失哈希(MLH)、潜在因子哈希(LFH)等。
虽然很多传统有监督哈希方法已经在检索性能上取得了不错的进展,但是随着近年来深度学习的迅速发展,深度哈希方法在很多基准测试中表现出更优异的性能,这是由于相比于传统哈希方法使用手工制作特征,深度哈希通过卷积神经网络(CNN)提取出了更加准确的特征。同时深度哈希能够端对端的同时进行特征学习和哈希码学习,而传统哈希方法分离了这两个过程,导致两者并不能达到最优兼容。因此深度哈希方法在许多基准测试上取得了很出色的表现,这得益于其良好的学习非线性哈希函数的能力。目前比较具有代表性的深度哈希方法有:深度监督哈希(DSH)、深度量化网络哈希(DQN)、深度监督离散哈希(DSDH)和深度离散监督哈希(DDSH)等。然而这些方法在将高维数据映射到二进制数据时,扭曲了原始的特征分布并且损失了两者之间的相似性,同时目前大多数的深度哈希方法都采用汉明距离和内积的方式提升性能,其在联合学习保持相似性上还是有很大损失。
发明内容
为了有效的解决现有深度哈希方法存在的问题,本发明提供了一种基于余弦度量的深度哈希图像检索方法,该方法提出了一种余弦度量约束下的深度哈希框架来实现图像检索,本发明可以在同一个网络下保持联合学习的相似性并充分利用分类信息使得具有良好的检索性能。
本发明的具体步骤如下:
步骤一:对于数据集中的图像,随机选取一部分作为训练集,再从剩余数据中选出一部分作为测试集,最后剩余的部分作为数据库集。
步骤二:构建一个用于学习哈希函数的深度学习网络,对所构建的网络进行参数初始化,同时使模型在训练集上训练得到训练后的深度哈希网络模型,本发明的哈希函数学习的损失函数为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910450067.8/2.html,转载请声明来源钻瓜专利网。