[发明专利]一种基于VLAD双重自适应的图像检索方法有效
申请号: | 201510398691.X | 申请日: | 2015-07-08 |
公开(公告)号: | CN104951562B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 雷涛;吕慧;高红霄 | 申请(专利权)人: | 天云融创数据科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100025 北京市朝阳区东四环中路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类中心 描述符 图像检索 检索 双重自适应 大规模图像数据库 图像 计算查询图像 检索数据库 图像数据集 查询图像 检索结果 数据计算 图像集合 相似距离 有效计算 余弦距离 再次利用 重新计算 重要意义 保存 归一化 自适应 排序 粗糙 分配 | ||
本发明公开了一种基于VLAD双重自适应的图像检索方法,解决了大规模图像数据集检索中如何快速有效计算聚类中心并提高检索精确度的问题。本发明首先利用待检索的大规模图像数据库和粗糙的聚类中心,计算并保存分配到每一个聚类中心的所有描述符之和以及描述符的个数;然后利用保存的数据计算第一次的自适应聚类中心;再次利用描述符之和、其对应的描述符的个数以及新的聚类中心,针对每一个查询图像重新计算聚类中心,并求得VLAD;最后对VLAD进行两次归一化,利用余弦距离计算查询图像与待检索数据库中图像的相似距离,排序后取前N幅图像作为检索结果图像集合。本发明对提高大规模图像检索精确度具有重要意义。
技术领域
本发明涉及图像检索技术领域,特别是涉及一种基于VLAD双重自适应的图像检索方法。
背景技术
随着数字技术、传感技术和网络技术的飞速发展,图像的数量和内容越来越丰富。面对着这样一个巨大的、实时扩展、时刻变化的数据库,如何从中检索到自己感兴趣的相关信息,就显得尤为重要。面对这个需求研究人员开始越来越多地关注大规模图像的有效检索问题。在早期的研究中,研究者们引入了视觉词袋,增强了描述符的表达强度并减少了量化损失,取得了显著的效果。但是随着研究的不断深入和图像规模的迅速增大,图像描述符所占内存也越来越大,使得早期方法的局限性越来越明显。
近几年来研究者们引入了图像局部紧致描述符向量(VLAD),该图像描述符的维度很低,使得非常大的图像数据集的所有描述符仍然可以适应内存,由此开辟了一个权衡图像描述符内存占用和检索性能的研究主题。局部紧致描述符向量类似于视觉词袋,它们依赖于量化局部描述符(以SIFT特征为例)。但是它们又存在两点不同,一方面是:视觉词袋记录的是SIFT特征属于各聚类中心上的投影数目,而VLAD记录的是SIFT特征与其对应聚类中心的差值累加和。VLAD继承了原始SIFT特征的一些不变特性,如平面旋转不变性。另一方面是:VLAD检索系统可以不依赖于原始的局部描述符,而视觉词袋系统则需要利用原始的局部描述符进行空间校验和重排序等,因此当处理非常大的图像数据集时需要很大的存储空间来保存这些数据。
VLAD检索系统对特征的聚类中心有很强的依赖性,通过利用好的聚类中心计算得到的VLAD进行检索可以得到较高的精确度,反之,当聚类中心不好时精确度较低。聚类中心的好坏取决于聚类中心能否恰当的描述检索图像库中描述符分布的情况。面对大规模的图像数据集检索需求,如何快速自适应的计算出好的聚类中心并提高检索精确度成为一个亟待解决的问题。
发明内容
本发明为了解决大规模图像数据集检索中如何快速自适应的计算聚类中心并提高检索精确度的问题,提出了一种基于VLAD双重自适应的图像检索方法。
上述发明目的是通过以下技术方案实现的:
步骤1:利用待检索的大规模图像数据库和粗糙的聚类中心z,计算并保存分配到每一个聚类中心的所有描述符之和以及描述符的个数。
步骤2:通过上述保存的数据计算新的聚类中心
步骤3:利用步骤1中保存的数据和新的聚类中心针对每一个查询图像重新计算聚类中心z′,然后求得VLAD。
步骤4:对VLAD进行两次归一化,利用余弦距离计算查询图像与待检索数据库中图像的相似距离,排序后取前N幅图像作为检索结果图像集合。
所述步骤1的具体步骤为:对待检索大规模图像数据库A中的每幅图像提取SIFT特征,粗糙聚类中心是由图像数据库B通过K-均值聚类得到的,图像数据库B与图像数据库A相关但不一致。假设聚类中心个数为k,每一个SIFT描述符被分配到距其最近的聚类中心,保存分配到每一个聚类中心的描述符之和j=1,2…k以及其对应的描述符的个数nj,其中xj,i表示的是属于第j个聚类中心的第i个SIFT描述符。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天云融创数据科技(北京)有限公司,未经天云融创数据科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510398691.X/2.html,转载请声明来源钻瓜专利网。