[发明专利]一种基于二进制多索引哈希技术的图像检索方法在审
申请号: | 201510346696.8 | 申请日: | 2015-06-19 |
公开(公告)号: | CN104899326A | 公开(公告)日: | 2015-09-09 |
发明(设计)人: | 桑永胜;章毅;邓涵 | 申请(专利权)人: | 四川大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 成都弘毅天承知识产权代理有限公司 51230 | 代理人: | 杨保刚;刘贤科 |
地址: | 610064 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 二进制 索引 技术 图像 检索 方法 | ||
技术领域
本发明涉及图像检索技术领域,具体涉及一种查询效率高、空间资源占用率低的高基于二进制多索引哈希技术的图像检索方法。
背景技术
随着网络的飞速发展以及多媒体技术应用的不断普及,互联网上的图像数量已达到上亿级并正在不断地高速增长。截止2014年3月,Instagram分享图片数量已经超过了200亿张,并以每天多于4000万幅的速度增长。因此,如何在海量图像数据库中对图像建立高效的高维索引并实现精度高、速度快的相似图像检索,是多媒体领域研究的热点与难点。
早年,图像检索仅仅局限于“以字搜图”的方法,这种方法是基于关键字或文本的,他依靠人工标注的文本来搜索图像。虽然“以字搜图”迈出了图像检索的第一步,大大减少了图像搜索的难点,但检索出来的图像往往具有很大的局限性:例如对大规模图像进行标注的工作量太大,人工描述的文字可能具有歧义性,以及图像的轮廓纹理等内容很难进行人工标注等。
目前,越来越多的知名搜索引擎采用了基于图像内容的图像检索技术来搜索图像,例如谷歌、百度。基于图像内容的图像检索使大规模图像检索成为可能,克服了“以字搜图”的局限性。基于内容的图像检索步骤通常如下:首先,利用图像处理技术检测图像的视觉特征;其次,用数字描述检测到的特征并表示为高维的特征向量;然后,在生成的特征库中为高维的特征向量建立索引;最后,使用生成的高维索引对查询向量进行相似性查询。因此,图像检索问题转化为了高维向量相似性查询问题。由于图像特征往往维度很高,所以如何建立高效的高维索引是进行快速、准确的图像检索的关键。
目前,大规模图像检索中高维索引技术面临的挑战主要包括以下两个方面:
一、维数高引起的“维数灾难”
由视觉特征生成的描述子数据往往维数很高,比如SIFT特征128维、GIST特征960维。传统基于树结构的索引方法,在维数大于十时容易受到“维数灾难”的影响。近似最近邻ANN(Approximate Nearest Neighbor)的查询方法通过牺牲很小的精度换取了效率的大幅度提高,得到了广泛的研究和应用。典型的ANN算法如David M.Mount和Sunil Arya于1998年实现的ANN-package。但是ANN基于KD树结构,在维数达到几十时,仍然受到维数灾难的影响。随后Piotr Indyk等人根据近似最近邻搜索的思想,提出了局部敏感哈希LSH(Locality Sensitive Hashing)的概念,把查询时间降到了亚线性,消除了查询时间对维数的指数级依赖。LSH基于哈希表结构,通过计算哈希值可直接访问到数据所在的存储结构,在视频检索等领域得到了成功应用。但是LSH对数据空间均匀划分,不适用于多媒体领域非均匀分布的数据。对LSH的改进方法,主要针对查询扩展方面,并没有考虑哈希函数本身带来的问题。如何针对成百上千维的数据建立高维索引,并实现高效率高性能的近似最近邻查询算法,仍然是个有待于进一步研究的难点。
二、大规模数据引起的空间资源不足
面向大规模图像库的检索对高维索引提出了新的要求。在大规模的数据规模下,内存资源成为瓶颈。例如,对一幅图像提取的SIFT局部特征数大约有102~103,在百万级规模的图像库下原始特征至少消耗500G的空间。庞大的数据无法在内存中存储,而基于磁盘的查找又严重影响了检索效率。针对这一问题,学者们提出了对数据压缩后建立索引的方法,本发明称为“压缩索引”。代表性方法如谱哈希,基于随机投影的中国科学院博士学位论文──面向大规模图像检索的高维索引技术研究二进制码和量化方法等。压缩索引方法大大缓解了空间资源不足的问题,但以损失查询精度为代价。将数据编码为二进制码是目前常用的压缩索引方法,但是现有方法对二进制码的索引往往采用线性查询的方式,查询效率有待于进一步提高。
图像检索的过程通常为以下几个步骤:首先,利用计算机图像处理技术检测图像的视觉特征;其次,用数字表示检测到的特征并生成高维特征向量;然后,对高维特征向量建立索引;最后,利用索引对高维向量进行检索。其中,图像查询是在线进行的,所以对实时性要求很高。为了提高查询效率,我们使用二进制特征描述图像内容。
发明内容
针对上述现有技术,本发明的目在于如何提供一种查询效率高、空间资源占用率低的高基于二进制多索引哈希技术的图像检索方法,旨在百万级甚至千万级的大规模图像数据库中准确快速的图像检索。
为了解决上述技术问题,本发明采用如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川大学,未经四川大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510346696.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:安装和运输方便的组合式毛巾架
- 下一篇:一种冰感毛巾