[发明专利]一种图像高维特征的相似比较方法及装置在审

专利信息
申请号: 201510436176.6 申请日: 2015-07-23
公开(公告)号: CN105095435A 公开(公告)日: 2015-11-25
发明(设计)人: 林熙东;牟川 申请(专利权)人: 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中原信达知识产权代理有限责任公司 11219 代理人: 姜劲;陆锦华
地址: 100080 北京市海淀区杏石口路6*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 图像 特征 相似 比较 方法 装置
【说明书】:

技术领域

发明涉及计算机技术领域,特别地涉及一种图像高维特征的相似比较方法及装置。

背景技术

在当今互联网环境下,网络用户除了文字检索需求外还希望能够对声音、图像、视频等多媒体内容进行检索。具体到图像检索,用户希望能够通过用户提供的图像作为查询(Query),请求互联网服务提供商找出与该图片内容相似的候选图片集合,应用场景如电商企业根据用户提供的商品图片向其推荐同款或相似款的商品,各搜索网站根据用户提供的风景图片显示相似图片等。

传统的图像检索一般是基于人工指定的图像特征进行相似度量,由于图像数据在语义上的非结构化特点,使得要靠人工发现富有表达力的特征是个比较困难的任务。Hinton等人提出的深度学习神经网络技术能够自主学习完成特征提取,即从原始图像的高维特征向量空间到较低维特征向量空间的有效映射,大大提高了图像领域的特征表达效率。

在互联网行业,服务企业的存量图像往往数量巨大。面对用户的检索需求,如果需要在秒级响应时间内得到检索结果,除了采用大规模并行计算技术外,还需要同时在降维与索引、匹配算法上提高速度。局部敏感哈希(LocalitySensitiveHashing,LSH)算法是一种降维编码技术,其特点是在生成的哈希编码中保留了原始特征空间中的相对位置关系,因此可以用于图像的快速检索。

在现有技术中,局部敏感哈希算法用于图像检索主要包括如下步骤:

1、图像的局部敏感哈希编码过程

图像的局部敏感哈希编码过程如图1所示。原始图像针对RGB通道表示为n维向量,经过卷积神经网络(CNN)编码后取其某一隐层(一般在倒数2~4层间取)的输出作为图像的m维特征向量(典型的长度为4096维)。该特征向量随后经过一组局部敏感哈希向量运算后转换为k(k远小于m)维的LSH编码。按照此种方法,服务企业将其所有的图片转化为这种编码,那么后续的图像相似检索都是基于图像的这种表示方式进行的。

2、图像相似检索过程

图像相似检索过程如图2所示。用户上传的查询图像先经过上述步骤1得到其局部敏感哈希LSH编码A,接着对局部敏感哈希向量表中的每一个向量B,计算A、B两者的汉明距离,然后根据所得的距离从小到大排序,最后取靠前的若干个向量所对应的原始图像作为相似检索的结果返回给用户。

但是,在使用过程中,发现现有的局部敏感哈希算法用于图像检索的方法存在以下缺点:

1、基于LSH编码的相似检索速度在图像集比较大(如包含百万、千万及以上的图片)时仍然比较慢;

2、汉明距离度量虽然计算速度比欧氏距离度量、曼哈顿距离度量等要快,但是精度下降比较多,检索结果不尽如人意。

发明内容

有鉴于此,本发明提供一种图像高维特征的相似比较方法及装置,通过对图像的局部敏感哈希编码进行分段索引及检索,并选用曼哈顿距离进行相似度量的方法,能够在基于局部敏感哈希编码的海量图片相似检索中提高检索速度与检索精度。

为实现上述目的,根据本发明的一个方面,提供了一种图像高维特征的相似比较方法。

本发明的一种图像高维特征的相似比较方法包括:将所提取的图像特征向量通过局部敏感哈希算法进行降维处理后得到低维特征向量;将所述低维特征向量平均分段并建立分段索引表;通过将查询图像的分段后的低维特征向量在所述分段索引表中进行检索得到候选样本集;将所述候选样本集中的样本分别与所述查询图像的低维特征向量进行相似度量。

可选地,所述图像特征向量是利用深度学习技术构建神经网络来提取的。

可选地,所述神经网络为卷积神经网络。

可选地,将所述低维特征向量平均分段的步骤之前,还包括:在一个较小的验证集上通过实验确定最优的分段长度。

可选地,将所述低维特征向量平均分段并建立分段索引表的步骤包括:将所述低维特征向量平均分段,以分段后的特征向量作为索引项,并计算每个索引项的指纹值;将所述指纹值对与所述分段索引表包含的预定的入口个数最接近的素数进行取余运算,得到所述索引项的入口地址;将所述低维特征向量根据得到的所述入口地址插入所述分段索引表中以建立分段索引表。

可选地,通过将查询图像的分段后的低维特征向量在所述分段索引表中进行检索得到候选样本集的步骤包括:通过访问查询图像的所述分段后的低维特征向量的入口地址,得到冲突集;将与所述查询图像的分段后的低维特征向量的指纹值相同的所述冲突集节点对应的所述低维特征向量提取出来,作为候选集;把各个分段检索得到的所述候选集合并起来,去掉其中重复的所述低维特征向量,得到候选样本集。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510436176.6/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top