[发明专利]一种网络环境下的近似重复图像搜索方法有效
申请号: | 201410602359.6 | 申请日: | 2014-10-31 |
公开(公告)号: | CN104462199B | 公开(公告)日: | 2017-09-12 |
发明(设计)人: | 胡卫明;李峻;兴军亮 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京瀚仁知识产权代理事务所(普通合伙)11482 | 代理人: | 宋宝库 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 网络 环境 近似 重复 图像 搜索 方法 | ||
1.一种网络环境下的近似重复图像搜索方法,其特征在于,该方法包括离线阶段和在线阶段,步骤如下:
离线阶段:
步骤A1:提取和描述输入网络图像的低层局部特征;
步骤A2:利用上述局部特征构建视觉词典,并将上述局部特征量化后,生成图像的全局特征描述;
步骤A3:构建倒排序索引;
在线阶段:
步骤B1:提取和描述给定查询图像的低层局部特征;
步骤B2:将B1中所获得的局部特征量化;
步骤B3:计算查询图像与离线阶段所输入网络图像的相关性,并对待匹配图像进行排序;
其中,所述步骤A2包括:
步骤A21:选取图像训练集,并提取图像训练集中所有图像的局部特征作为训练特征集,通过无监督K-均值聚类法,对训练特征集进行聚类进而生成视觉词典;
步骤A22:对视觉词典进行更新,使得词典适应于输入的网络图像并保持一致性;
步骤A23:在得到更新后的词典之后,利用局部约束线性编码的方法,将输入的网络图像中的所有特征进行量化,并映射到视觉词典上;
步骤A24:利用图像金字塔对图像进行弱分割,将量化后的局部特征按照分块原则进行特征的聚集,并生成图像的分块表示;
步骤A25:将不同层次上的所有图像分块表示串联起来,生成一幅图像的整体表示。
2.根据权利要求1所述的方法,其特征在于,步骤B1与步骤A1中的所述的局部特征提取方法相同,步骤B2与步骤A2中所述的局部特征量化方法相同。
3.根据权利要求2所述的方法,其特征在于,所述步骤A1包括:
步骤A11:对于输入的网络图像进行局部关键点的提取,并去除离群噪声点;
步骤A12:对所有保留的关键点,在其周围领域统计相关梯度方向信息,并生成基于梯度方向直方图的特征描述子。
4.根据权利要求2所述的方法,其特征在于,所述步骤A3包括:离线阶段对于输入网络图像中的所有图像表示按照视觉单词目录建立倒排索引,并计算词频和倒排文档频率。
5.根据权利要求2所述的方法,其特征在于,所述步骤B3包括:
步骤B31:通过计算词频以及倒排文档频率加权求和的方法计算给定查询图像与输入网络图像之间的相关性;
步骤B32:按照图像的相关性对待匹配图像进行排序,返回图像序列中排在前面的图像,作为给定查询图像的近似重复图像。
6.根据权利要求1所述的方法,其特征在于,步骤A24中所述图像金字塔为两层图像金字塔,第一层为图像本身,第二层被分为2*2图像单元。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410602359.6/1.html,转载请声明来源钻瓜专利网。