[发明专利]一种基于VLAD双重自适应的图像检索方法有效
申请号: | 201510398691.X | 申请日: | 2015-07-08 |
公开(公告)号: | CN104951562B | 公开(公告)日: | 2018-06-05 |
发明(设计)人: | 雷涛;吕慧;高红霄 | 申请(专利权)人: | 天云融创数据科技(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100025 北京市朝阳区东四环中路*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于VLAD双重自适应的图像检索方法,解决了大规模图像数据集检索中如何快速有效计算聚类中心并提高检索精确度的问题。本发明首先利用待检索的大规模图像数据库和粗糙的聚类中心,计算并保存分配到每一个聚类中心的所有描述符之和以及描述符的个数;然后利用保存的数据计算第一次的自适应聚类中心;再次利用描述符之和、其对应的描述符的个数以及新的聚类中心,针对每一个查询图像重新计算聚类中心,并求得VLAD;最后对VLAD进行两次归一化,利用余弦距离计算查询图像与待检索数据库中图像的相似距离,排序后取前N幅图像作为检索结果图像集合。本发明对提高大规模图像检索精确度具有重要意义。 | ||
搜索关键词: | 聚类中心 描述符 图像检索 检索 双重自适应 大规模图像数据库 图像 计算查询图像 检索数据库 图像数据集 查询图像 检索结果 数据计算 图像集合 相似距离 有效计算 余弦距离 再次利用 重新计算 重要意义 保存 归一化 自适应 排序 粗糙 分配 | ||
【主权项】:
一种基于VLAD双重自适应的图像检索方法,其特征在于,该方法是按照以下步骤进行的:步骤1:利用待检索的大规模图像数据库和粗糙的聚类中心z,计算并保存分配到每一个聚类中心的所有描述符之和以及描述符的个数;步骤2:通过上述保存的数据计算新的聚类中心分配到每一个聚类中心的描述符之和sj是一个128维的向量,利用与其对应的描述符个数nj求平均向量,即得新的k个聚类中心,表达式为:其中表示第j个新的聚类中心;步骤3:利用步骤1中保存的数据和新的聚类中心针对每一个查询图像重新计算聚类中心z′,然后求得VLAD;在检索过程中,针对每一个查询图像提取其SIFT特征,并将SIFT特征分配给最近邻的由步骤2得到的聚类中心保存查询图像中每个聚类中心的描述符之和以及其对应的描述符个数其中表示查询图像根据新的聚类中心重新分配到第j个聚类中心的第i个描述符;重新计算新的描述符之和以及其对应描述符个数然后通过得到最终的自适应聚类中心z′,并根据z′计算每幅图像的VLAD;VLAD的构造过程是将一幅图像的所有描述符分配到k个聚类中心的最近邻类别中,计算描述符与其聚类中心的残差,属于同一聚类中心的残差被累加起来,k个128维的残差之和被连接成为一个单独的k*128维度的描述符,即为未归一化的VLAD;具体计算公式如下: 其中vj表示每幅图像分配到第j个聚类中心z′j的残差之和,x′j,i表示每幅图像分配到第j个聚类中心z′j的第i个描述符;步骤4:对VLAD进行两次归一化,即对每一个VLAD中分配到每一个聚类中心的残差之和vj进行L2范数归一化,然后再对拼接后的向量v进行L2范数归一化;利用余弦距离计算查询图像与待检索数据库中图像的相似距离,排序后返回前N幅图像作为检索结果图像集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天云融创数据科技(北京)有限公司,未经天云融创数据科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510398691.X/,转载请声明来源钻瓜专利网。