[发明专利]一种网络环境下的近似重复图像搜索方法有效
申请号: | 201410602359.6 | 申请日: | 2014-10-31 |
公开(公告)号: | CN104462199B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 胡卫明;李峻;兴军亮 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 宋宝库 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 环境 近似 重复 图像 搜索 方法 | ||
技术领域
本发明涉及网络多媒体信息处理领域,特别涉及一种网络图像搜索技术。
背景
随着互联网的普及和信息处理技术的不断发展,网络多媒体信息处理成为日益关注的焦点。多媒体包括文本,图形,声音,图像动画等各种信息院。由于当前图像处理的技术日新月异,网络图像数据量也呈现爆炸式的增长,然而这里面包含了很多经过编辑、修饰、拼接之后的重复图像。这就带来了图像盗版和侵权的问题。近年来对于近似重复图像搜索问题,众多学者展开了广泛的研究。不失一般性,近似重复图像搜索指的是找到所有的给定图像的变换拷贝图像,本发明关注的是“图像”类的近似重复图像搜索,即所有的拷贝图像和原始图像共有同源图像。
为了有效解决近似重复图像搜索的问题,视觉词包模型成为一种被广泛应用的解决方案,它提供了一种局部图像描述的有效统计信息,并同时生成一种紧致的基于直方图统计的图像表示。词包模型最早应用于目标检测和图像分类领域。由于传统的词包模型没有考虑特征的空间分部信息,而近似重复图像存在局部差异性和整体相似性的特点,所以在进行特征量化的阶段,需要将特征的空间分布统计和特征量化相结合,对图像进行基于空间感知的区域量化。
图1为网络近似重复图像的示例图,从图中可以看出,网络环境下的近似重复图像包括了更多更显著的图像变换,如:文字嵌入、图像剪裁拼接等等,这些变换明显改善了图像表观,都为网络近似重复图像搜索带来了极大的挑战。
发明内容
本发明的目的在于提出一种对图像进行基于空间感知的量化方法,以解决网络环境下近似重复图像搜索的问题。
为实现上述目的,本发明提出一种基于空间感知的网络近似重复图像搜索方法,其方法包括离线阶段和在线阶段,步骤如下:
离线阶段:
步骤A1:提取和描述输入网络图像的低层局部特征;
步骤A2:利用上述局部特征构建视觉词典,并将上述局部特征量化后,生成图相的全局特征描述;
步骤A3:构建倒排序索引;
在线阶段:
步骤B1:提取和描述给定查询图像的低层局部特征;
步骤B2:将B1种所获得的局部特征量化;
步骤B3:计算查询图像与离线阶段所输入网络图像的相关性,并对带匹配图像进行排序。
优选的,步骤B1与步骤A1中的所述的局部特征提取方法相同,步骤B2与步骤A2中所述的局部特征量化方法相同。
优选的,所述步骤A1包括:
步骤A11:对于输入的网络图像进行局部关键点的提取,并去除离群噪声点;
步骤A12:对所有保留的关键点,在其周围领域统计相关梯度方向信息,并生成基于梯度方向直方图的特征描述子。
优选的,所述步骤A2包括:
步骤A21:选取图像训练集,并提取图像训练集中所有图像的局部特征,通过无监督K-均值聚类法,对训练特征集进行聚类进而生成视觉词典;
步骤A22:在线更新视觉词典,使得词典适应于输入的网络图像并保持一致性;
步骤A23:在得到更新后的词典之后,利用局部约束线性编码的方法,将输入的网络图像中的所有特征进行量化,并映射到视觉词典上;
步骤A24:利用图像金字塔对图像进行弱分割,将量化后的局部特征按照分块原则进行特征的聚集,并生成图像的分块表示。
步骤A25:将不同层次上的所有图像分块表示串联起来,生成一幅图像的整体表示。
优选的,所述步骤A3包括:
离线阶段对于输入网络图像中的所有图像表示按照视觉单词目录建立倒排索引,并计算词频和倒排文档频率。
优选的,所述步骤B3包括:
步骤B31:通过计算词频以及倒排文档频率加权求和的方法计算给定查询图像与输入网络图像之间的相关性;
步骤B32:按照图像的相关性对待匹配图像进行排序,返回图像序列中排在前面的图像,作为给定查询图像的近似重复图像。
优选的,步骤A24所述图像金字塔为两层图像金字塔,第一层为图像本身,第二层被分为2*2图像单元。
本发明所提出的基于空间感知的网络近似重复图像搜索方法,可以将特征的空间分布统计信息嵌入图像特征表示,能够充分利用近似重复图像的局部差异性和全局相似性的特点,所以本发明在近似重复图像搜索准确度方面比传统的视觉词包模型的准确度更高。
附图说明
图1为网络近似重复图像示例图。
图2为本发明所采用的空间金字塔分割图像示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410602359.6/2.html,转载请声明来源钻瓜专利网。