[发明专利]一种基于层次索引的图像检索方法及系统有效
申请号: | 201310589470.1 | 申请日: | 2013-11-20 |
公开(公告)号: | CN103617217B | 公开(公告)日: | 2017-04-26 |
发明(设计)人: | 谢洪涛;杨青娅;徐克付;谭建龙 | 申请(专利权)人: | 中国科学院信息工程研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京轻创知识产权代理有限公司11212 | 代理人: | 杨立 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 层次 索引 图像 检索 方法 系统 | ||
技术领域
本发明涉及一种基于层次索引的图像检索方法及系统,属于大规模图像检索领域。
背景技术
随着互联网和多媒体技术的飞速发展,互联网上的图像数量已达到了数千亿级并呈现不断增长的趋势。以著名社交网站Facebook和图像分享网站Flicker为例,截止到2011年6月,Facebook约有1000亿副图像,Flicker用户每天上传的图像就有450万副。如何建立有效的检索机制,在浩瀚的图像库中实现快速、有效的目标图像检索,成为多媒体领域亟待解决的问题。
图像的检索问题可以分为基于关键字的图像检索和基于内容的图像检索。基于关键字的图像检索需要人工对图像标注,赋予图像语义信息。这种方法有局限性,人工标注的语义内容可能存在歧义,图像本身的一些纹理特征很难准确描述,而且对大规模图像标注需要很大的工作量。
基于内容的图像检索,利用图像自身包含的丰富信息,如:颜色,纹理,关键点等等进行图像检索,即以图搜图。这种方法克服了早期基于关键字的图像检索的局限性。基于内容的图像检索过程如图1所示,大致分为三个步骤。首先,根据计算机视觉技术或图像处理技术提取库图像的特征点,对特征点进行描述生成高维特征描述符。然后,采用一种方式将高维特征描述符有效的组织起来,这个过程就是建立索引的过程。最后,提取查询图像的特征点,生成查询特征描述符。在索引中检索,返回与查询特征相似的特征,从而得到与此相似的图像。
发明内容
因为对大规模图像提取特征点,产生海量高维特征描述符,所以需要一种有效的索引机制将特征描述符有效的组织起来,以提高检索的效率。另外,海量高维特征描述符对内存的要求也是一个亟待解决的问题。如何在准确率,速度和空间方面取得平衡,一直是大规模图像检索领域的研究热点。
本发明所要解决的技术问题是,针对现有技术的不足,提供一种实现大规模图像的有效检索的层次检索方法。
本发明解决上述技术问题的技术方案如下:一种基于层次索引的图像检索方法,具体包括以下步骤:
步骤1:对库图像提取二进制特征,并将二进制特征存入特征库;
步骤2:对特征库中的每个二进制特征随机提取24位作为新特征,由新特征组成新数据集;
步骤3:对新数据集建立聚类索引,使新数据集的搜索空间分层;
步骤4:接收查询图像,提取查询图像的查询特征,对查询特征随机提取24位构成新查询特征,并将新查询特征与新数据集中的新特征进行匹配得到候选特征,由候选特征组成候选集,完成初步过滤;
步骤5:将候选集中的候选特征与原查询特征进行相似度计算,得到多个相似特征构成相似数据集,完成图像检索。
本发明的有益效果是:本发明基于二进制特征建立层次索引结构,采用层次索引结构对与查询相似的特征进行初步过滤,得到候选结果集合。将查询特征与候选结果集合中的特征逐一比较,返回真正的最近邻特征。与基于sift特征的索引结构相比,该索引结构使得检索效率明显提升,空间资源消耗降低。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述步骤3具体包括以下步骤:
步骤3.1:在新数据集中随机选取n个新特征作为簇中心,加入簇中心集;
步骤3.2:分别计算新数据集中的每个特征与每个簇中心的距离,将所述新特征添加到距离最近的簇中心构成一个分类簇,完成第一层的聚类过程,将新数据集的特征分成了n类集合;
步骤3.3:判断上一步骤得到的n类集合中一类集合包含的特征数目是否达到阈值数目,如果大于阈值数目,则将该类集合作为新数据集,并跳转至步骤3.1;否则,该类停止聚类过程;
步骤3.4:重复步骤3.3,直到所有的类包含的特征数目小于阈值数目为止,聚类结束,完成搜索空间的分层过程。
其中,n为自然数。
进一步,如果在步骤3分层过程中某个簇包含的特征小于某一个设定的阈值,那么这个簇就不在继续向下分层。
进一步,所述步骤3.1具体包括以下步骤:
步骤3.1.1:在新数据集中随机选择一个新特征作为一个准簇中心;
步骤3.1.2:任意选择一个新数据集中的新特征,计算所述新特征与准簇中心的距离;
步骤3.1.3:判断所述新特征与准簇中心的距离是否大于设定的距离阈值,如果是,将所述新特征作为簇中心,并添加到簇中心集中;否则,放弃所述新特征,跳转至步骤3.1.2;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所,未经中国科学院信息工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310589470.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种去除餐饮废水中氨氮的装置
- 下一篇:一种碗架
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序