[发明专利]一种基于内容检索相同或相似图像的方法与系统有效
申请号: | 201510433542.2 | 申请日: | 2015-07-21 |
公开(公告)号: | CN104991959B | 公开(公告)日: | 2019-11-05 |
发明(设计)人: | 布如国;牟川;邢志峰;林熙东 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F16/583 | 分类号: | G06F16/583 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 姜劲;陆锦华 |
地址: | 100080 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 内容 检索 相同 相似 图像 方法 系统 | ||
本发明提供一种基于内容检索相同或相似图像的方法与系统,通过对图像进行全量降维并建立索引,以搭建小规模的数据集群即能满足类实时搜索相同或相似图像,检索精度高、时间短。该方法包括:对图像进行去重处理后,利用卷积神经网络模型提取图像的特定层的全连接特征向量;对提取的特定层的全连接特征向量进行降维,并将降维后的特征向量与图像的标识符及属性信息相关联;将降维后的特征向量及图像的标识符在分布式的检索集群中建立索引,并批量插入图像的数据信息;通过对降维后的特征向量在分布式的检索集群中进行相似度量,将满足预定阈值的图像确定为相同或相似图像。
技术领域
本发明涉及计算机技术领域,特别地涉及一种基于内容检索相同或相似图像的方法与系统。
背景技术
常规的图像检索,是通过输入关键词的形式搜索到互联网上相关的图片资源,查找出自己所需要的特定图片。但是对于某个特定的图像特征,通常又有多种不同的表达方法。由于人们主观认识上的千差万别,对于某个特征并不存在一个所谓的最佳的表达方式,这样在进行图像检索时就会出现检索精度低,甚至检索不到需要的图片的情况。因此,基于内容的图像检索使用越来越多。
基于内容的图像检索为从大量图像中检索出特定内容的图像提供了有效的方法,一般使用一些特征提取的方法提取出图像的特征,然后再检索比较。现有的图片搜索引擎在进行相似图片搜索时,主要有如下两种方式:
1、根据输入的关键字,在搜索结果中挑选一张图片,再根据这张图片的特点来进行搜索,例如:Xcavator、Live.com、Picitup等,其中,图片的特点主要指色彩、形状等方面的特征;
2、通过上传本地图片或输入网络图片的URL地址,自动分析图像中的元数据,作为搜索的关键数据,例如,颜色、形状、主题风格等,取出多个像素点,提取特征值,寻找相似的图片,例如:百度识图、Gazopa、Byo image search等。
由上述可知,现有的基于内容的图像检索主要是根据图像的颜色、形状、主题风格等特征,取多个像素点提取特征值以寻找相似的图片。然而,通常情况下,不同的特征提取方法对提取出来的结果影响甚大;对于检索响应时间,会随着图像数量的增多而逐渐拉长。且现有的大部分图像识别产品,针对性是全网搜索的图片,对特定领域的相同或相似图像检索精度并没有那么高。
因此,需要一种针对特定领域的相同或相似图像类实时检索的方法和系统。由于从海量的高维数据集合中找到相似数据计算复杂度非常高,因此对需要实时查询的系统而言,方案几乎不可取。但是,如果能把特征维度降低一个量级,然后对特征建立索引,那么通过查询请求即可做到类实时查询。
发明内容
有鉴于此,本发明提供一种基于内容检索相同或相似图像的方法与系统,通过对图像进行特征向量提取,并对提取的图像特征向量降维及建立索引,以搭建小规模的数据集群即能满足类实时搜索相同或相似图像,检索精度高、时间短。
为实现上述目的,本发明提供以下技术方案:利用卷积神经网络模型提取图像的高层特征向量,根据特征向量维度大小利用降维方法选择最优参数进行特征向量降维,降维后的特征向量插入实时检索集群,对于要查询的图像,用上述步骤提取降维后的特征向量,在实时检索集群中采用汉明距离进行相似度量,根据计算出来的分数得到相同或相似图像。
根据本发明的一个方面,提供了一种基于内容检索相同或相似图像的方法。
本发明的一种基于内容检索相同或相似图像的方法,包括:对图像进行去重处理后,利用卷积神经网络模型提取所述图像的特定层的全连接特征向量;对提取的所述特定层的全连接特征向量进行降维,并将降维后的特征向量与所述图像的标识符及属性信息相关联;将降维后的特征向量及图像的标识符在分布式的检索集群中建立索引,并批量插入所述图像的数据信息,其中所述数据信息包括所述降维后的特征向量、所述图像的标识符及属性信息;通过对所述降维后的特征向量在所述分布式的检索集群中进行相似度量,将满足预定阈值的图像确定为相同或相似图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510433542.2/2.html,转载请声明来源钻瓜专利网。
- 内容再现系统、内容提供方法、内容再现装置、内容提供装置、内容再现程序和内容提供程序
- 内容记录系统、内容记录方法、内容记录设备和内容接收设备
- 内容服务系统、内容服务器、内容终端及内容服务方法
- 内容分发系统、内容分发装置、内容再生终端及内容分发方法
- 内容发布、内容获取的方法、内容发布装置及内容传播系统
- 内容提供装置、内容提供方法、内容再现装置、内容再现方法
- 内容传输设备、内容传输方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容发送设备、内容发送方法、内容再现设备、内容再现方法、程序及内容分发系统
- 内容再现装置、内容再现方法、内容再现程序及内容提供系统
- 内容记录装置、内容编辑装置、内容再生装置、内容记录方法、内容编辑方法、以及内容再生方法