[发明专利]图片搜索方法及搜索系统无效
申请号: | 201010574563.3 | 申请日: | 2010-11-30 |
公开(公告)号: | CN102012934A | 公开(公告)日: | 2011-04-13 |
发明(设计)人: | 文林福 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦;李庆波 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 搜索 方法 系统 | ||
技术领域
本发明涉及搜索引擎技术,尤其涉及一种图片搜索方法及搜索系统。
背景技术
随着互联网上信息的飞速增长,网络上充斥了越来越多的冗余信息,而对于在网络上搜寻自己所需要信息的互联网用户而言,面对这些漫无边际的信息无疑像大海捞针。搜索引擎的出现无疑在一定程度上为用户的搜索需求带来了很大便利。搜索引擎是一种在网络上应用的软件系统,其以一定的策略在网络上搜集和发现信息,并在对信息进行处理和组织后,为用户提供互联网上的信息搜索服务。通常,这种软件系统提供一个网页界面,让用户在客户端通过浏览器软件提交搜索词,然后很快返回一个可能和用户输入的搜索内容相关的信息列表。这个列表通常会包括上万个条目,每个条目代表一篇搜索到的相关网页。
过去十几年以来,相应地,众多的互联网搜索引擎及对应的网站应运而生,这中间的佼佼者包括百度公司的百度搜索(www.baidu.com)和谷歌公司的谷歌搜索(www.google.cn)。
随着网络技术的不断发展,用户对搜索引擎的要求已经不再满足于只是对文本的搜索,很多用户还希望可以通过搜索引擎对网络图片进行搜索。然而,在目前的图片搜索系统中,如谷歌、YAHOO、BING等均是采用基于文本的搜索技术。基于文本的图片搜索是将图片作为数据库存储的对象,用关键字或自由文本对其进行描述。然而,对于图片中包含的视觉特征,如颜色或形状等,无法用文本对这些视觉特征进行客观的描述。当需要根据图片中包含的视觉特征搜索图片时,基于文本的搜索技术将不再适用。举例说明:现在多数使用搜索引擎的用户经常遇到这样的问题,在网站或电脑上看到一张图片,该图片可能是人物、风景、物品等,而并不知道该图片中的人物是谁、风景是在哪儿、物品是什么,如图1所示,该图片10是用户在网站上看到的一个物品,当用户想了解该图片10中的物品是什么时,很难将该物品的视觉特征用语言描述出来,即便表达能力较好的用户将其视觉特征描述出来了,也很难在现有的搜索引擎中找到与该图片相似的图片和相应的文本信息,导致搜索效率低下,使用网络流量较大。
中国专利申请第200910300147.1号,揭示了一种图片搜索系统及方法,该方法首先提取查询图片的视觉特征,再根据查询图片的视觉特征及图片索引数据库中各个图库图片的索引信息计算各个图库图片的相似度,并且利用分布式架构执行搜索任务,最后快速地搜索出与查询图片相似的图库图片。该系统包括提取模块,用于提取查询图片的视觉特征,并将查询图片的视觉特征发送给各个计算子节点服务器;分配模块,用于根据图片索引数据库的大小以及计算子结点服务器的数量给各个计算子结点服务器分配搜索任务,以使各个计算子结点服务器根据各个图库图片的索引信息及查询图片的视觉特征计算各个图库图片的相似度并返回各个图库图片的相似度及索引信息;汇总模块,用于对各个计算子结点服务器返回的各个图库图片的相似度及索引信息进行汇总;排序模块,用于将汇总后的各个图库图片的相似度发送给排序服务器,以使排序服务器根据各个图库图片的相似度对各个图库图片进行排序;输出模块,用于接收排序服务器的排序结果,并根据该排序结果输出各个图库图片的索引信息。然而这种图片搜索系统及方法均不是提供对全网图片的搜索,且只能根据图片搜索到其相似的图片,而并不能搜索到与之相对应的文本信息。
有鉴于此,需要提供一种图片搜索方法及搜索系统,可根据图片本身搜索其相似图片和对应文本信息,满足用户需求。
发明内容
本发明的目的在于提供一种改进的基于图片的搜索方法,其不仅可以通过图片搜索相似图片,还可以根据图片搜索到与之相对应的文本信息。
本发明的目的还在于提供一种实现上述基于图片的搜索方法的搜索系统。
为实现上述发明目的之一,本发明的一种基于图片的搜索方法,包括以下步骤:
S1、接收并处理上传图片;
S2、计算所述图片局部特征;
S3、通过所述图片局部特征在图片特征索引中搜索相似图片;
S4、通过所述相似图片在文本索引中搜索文本数据;
S5、输出所述相似图片与所述文本数据。
作为本发明的进一步改进,在所述S5前,还包括:
排序步骤,对搜索到的所述相似图片和所述文本数据进行排序。
作为本发明的进一步改进,所述排序参考因素为图片相似度。
作为本发明的进一步改进,所述排序参考因素为图片相似度、死链状态,以及网页权值。
作为本发明的进一步改进,所述S1步骤包括:
S11、接收用户上传图片;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010574563.3/2.html,转载请声明来源钻瓜专利网。