[发明专利]一种基于聚类的图像查询方法有效
申请号: | 200610171519.1 | 申请日: | 2006-12-30 |
公开(公告)号: | CN101211355A | 公开(公告)日: | 2008-07-02 |
发明(设计)人: | 高科;林守勋;张勇东 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京泛华伟业知识产权代理有限公司 | 代理人: | 高存秀 |
地址: | 100080北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图像 查询 方法 | ||
技术领域
本发明涉及图像内容表示与图像查询技术,特别涉及高维数据空间的聚类图像查询方法。
背景技术
随着网络的高速发展,各种类型的信息飞速增长。除文本之外,因特网(Internet)也在不断产生大量图像、视频等可视化数据。图像由于其直观鲜明、内容丰富的特点,成为一种重要的信息载体,是组成多媒体的重要内容。根据人们日益增长的对可视化数据的需求,如何对这些海量信息进行有效的分析、管理、查询和检索,成为目前亟待解决的问题。
传统的检索系统主要通过图片的文件名以及部分网页文字信息来建立索引,对图像进行描述和检索。但是,手工标注的开销太大,而且具有主观性,并且很难用文字来描述图像中含有的视觉信息,如颜色、纹理、轮廓等感知元素。因此,基于内容的大型图像数据库的索引和检索在近年成为众多关注的课题。
图像内容的表示和特征的提取问题,是图像理解的基础和核心所在。对图像内容的理解,其本质就是提取像素点分布的统计规律,从而进行相似性的计算与度量。颜色、纹理、形状,以及边缘等被提取出来作为常用的图像描述特征。
提取描述图像内容的特征之后,图像被映射为高维数据空间中的样本点。对于海量数据而言,如何建立有效的索引结构,是加快检索速度、提高检索精度的关键问题。同时,与图像对应的都是高维数据点,常用的索引方法已难以满足需要,具有动态性、高效性、鲁棒性和集成性的高维索引结构己成为热门的研究方向。
常用的高维索引是树型空间索引,分为基于数据划分和基于空间划分两类,前者划分数据集,并建立数据子集的包含区域的层次结构,比如R树、R*树、SS树等;后者将数据空间划分为不相交的子空间,并建立子空间的层次结构,比如Quadtree、K-D树等。在目前的大型数据库检索系统中,普遍采用了R*树作为索引的数据结构。它的主要思想是:基于最小包含矩形MBR(Minimum BoundaryRectangle)划分数据,使空间上靠近的空间对象拥有尽可能近的共同祖先。在分裂节点和选取最优子树时,采用多样化的衡量指标,除采用R树中的面积指标外,还引入周长、矩形重叠面积等指标。针对R树结构受数据输入次序影响的问题,R*树采用强制重新插入策略,对树中已有节点中的单元进行有选择的重新插入,优化树的整体结构,有助于提高查询性能。代价仅仅稍高于R树,同时支持点数据和其他空间数据的索引建立与查询。详情参见文献Beckmann H-P Kriegel,R Schneider,BSeeger.The R*-Tree:An Efficient and Robust Access Method for Points andRectangles[C].In:Proc ACM SIGMOD,1990:322-331.
大部分树型空间索引在低维空间中性能优越,但在高维空间中,性能下降,这是因为一些重要的参数,如体积、面积等,都和空间维数呈幂级增长的关系。R*树对10维以下的数据集有较理想的处理效果,但当维数超过20时,在高维空间中出现大量MBR重叠,导致结构退化,引起性能下降。并且,现实应用中提取的数据集,如从检索图像、视频关键帧中提取的特征描述子,在整个特征空间中往往是非均匀分布的,这就会导致大量空结点或稀疏边界矩形的产生,严重影响检索效率。
发明内容
本发明的目的是克服现有技术的不足,提供一种基于聚类的图像查询方法,用于大规模图像库中快速检索与目标图像相似的数据图像。
为了达到上述目的,本发明采取如下技术方案:
一种基于聚类的图像查询方法,包括以下步骤:
(1)提取目标图像和图像数据库中每幅图像的颜色特征和纹理特征;
(2)对描述图像内容的高维特征进行降维,得到特征子集;
(3)对特征子集构成的数据集进行聚类;
(4)对聚类得到的每个类分别建立索引;
(5)进行图像查询。
进一步地,步骤(1)中,提取颜色特征的步骤包括:①将图像固定划分为N块,N为大于或等于3的整数;②给每个分块赋予权重。
进一步地,步骤(2)中,对高维特征进行降维,选择全局颜色矩来作为表征图像内容的特征向量。
进一步地,步骤(3)中,所述聚类是结合网格的样本密度聚类。
进一步地,图像固定分块数N=5。
进一步地,选择全局颜色矩是选取颜色的一阶矩、二阶矩和三阶矩来作为表征图像的特征向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200610171519.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序