[发明专利]一种服饰鞋包类商品图像多视觉特征融合方法无效
申请号: | 201210545616.8 | 申请日: | 2012-12-14 |
公开(公告)号: | CN103049513A | 公开(公告)日: | 2013-04-17 |
发明(设计)人: | 张继霞;孙凯 | 申请(专利权)人: | 杭州淘淘搜科技有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 周烽 |
地址: | 310012 浙江省杭州市文二*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 服饰 鞋包类 商品 图像 视觉 特征 融合 方法 | ||
技术领域
本发明涉及信息检索和数据挖掘技术领域,特别是涉及一种基于多种视觉特征融合的图片检索方法。
背景技术
图像检索研究兴起自上世纪90时代,早期的图像检索更多的是基于文本的图像检索,随着互联网和多媒体技术的快速发展,图像等多媒体信息呈爆炸性增长。传统基于文本的信息检索技术已经逐步不能满足人们的检索需求。市场调查显示,面对一件衣服,用户给出多个文本描述词汇,都很难从现有的海量网络商品图库中检索出自己所想找的那件商品。Toml等在《A Picture is Worth a Thousand Keywords:Image-Based Object Searchon a Mobile Platform》一文中明显提到在图像搜索中图像内容相对于文本的高效性。同时图像本身具有信息丰富、不受语言限制、便于交流等优点。在这种背景下,基于内容的图像检索技术得到了广泛的发展。利用图像视觉特征,如颜色、形状、纹理等信息,如何迅速而准确地从浩瀚的海量图像数据库中检索到所需的图像,成为近年来计算机视觉领域的研究热点问题,基于内容的图像检索技术因此应运而生。
现有的图像检索方法中,基本的检索步骤包括以下几步:提取图像视觉底层特征写入对应的图像库;将用户输入的待检索图像进行视觉底层特征提取;与图像库中的特征进行相似度匹配度量,按相似度度量排序返回给用户。其中,视觉底层特征的提取主要包括颜色特征、形状特征以及纹理特征。颜色特征提取中常用的算法有颜色直方图、颜色矩方法等;形状特征中的常用算法包括zernike矩、HU不变矩、GIST等方法;纹理特征算法主要有Tamura纹理特征(粗糙度、方向度、对比度)、共生矩阵、Gabor滤波算法等等。
在针对商品图片的图像检索应用过程中,通过市场调研发现用户针对不同类目的商品会有不同的关注点,例如对于服饰,因为存在模特图和商品平铺图,图像中的商品难免存在形变,所以用户对服饰的关注度从主到次依次是:纹理、颜色、形状;而对于鞋包类商品图,由于此类商品形变较小,则用户更关注商品的款式,所以关注度从主到次依次是:形状、颜色、纹理。现有的图像检索方法在图像库内匹配时大多是通用型匹配模式,这很难满足用户在各类目上的检索需求。另外在没有人工交互框选的情况下,对于形状特征,在背景复杂的商品图像上效果均不佳,合理地针对商品图像的背景做些区分,对形状特征的检索效果也有较大提升。
发明内容
本发明的目的是克服现有技术的不足,提供一种能根据待检索商品图像背景复杂与否,并能结合不同商品类目能采取不同融合策略的多视觉特征融合的图像检索方法,从而能满足用户不同类目的检索需求。
本发明的目的是通过以下技术方案来实现的:
(1)图像库特征的提取:提取图像库中的每个图像的颜色、纹理、形状视觉特征,其中部分颜色和形状特征,采用主动分块策略,分为上、下、左、右、图像中心块5个子块和全图块,共6个块图像,提取出每个块的视觉特征。将多种特征合并成为表示该图像的特征向量加入图像库;
(2)由于海量图像库中检索,对步骤1)得到的图像特征库进行KMeans聚类切分,保证查全率的前提下,提升检索性能;
(3)对于用户输入的待检索商品图像,用背景检测算法检测该图像的背景复杂度,并根据复杂度对检索图像提取不同的视觉底层特征(形状,颜色,纹理等),并将多种特征合并成为表示该图像的特征向量;
(4)计算步骤3得到的待检索的图像特征向量与聚类切分后的各个聚类中心的距离度量,寻找最近聚类簇;
(5)计算步骤3得到的待检索的图像特征向量与步骤4)得到的最近聚类簇中的所有图像特征向量之间的相似度度量:先对各种类型的特征(颜色、形状、纹理等)分别计算距离度量,然后对度量分别做聚类簇内的归一化,在按不同类目配置的权重,线性组合得到最终的相似度度量;
(6)将步骤5得到的相似度度量进行升序排序,将排序后的前若干个结果返回给用户,即为所检索的结果;
本发明的有益效果是,本发明首先对用户输入的待检索商品图片,以图片背景单一或者复杂进行分类,并根据背景单一与复杂两种不同的情况,相应地抽取不同的多种底层视觉特征;在与图像库中匹配过程中引入了商品类目相关的底层视觉特征权重表,这样检索的结果能体现出不同商品类目的视觉特性相应的偏重,从而满足不同商品类目检索的客户需求,提高了用户体验效果。
附图说明
图1是图片数据集入库的流程图;
图2是检索用户输入商品图片的流程图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州淘淘搜科技有限公司,未经杭州淘淘搜科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210545616.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种金钱草排石酒及泡制方法
- 下一篇:SMT贴片红胶及其制备方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序