[发明专利]图片搜索设备、方法及系统有效
申请号: | 201310492161.2 | 申请日: | 2013-10-18 |
公开(公告)号: | CN103559220B | 公开(公告)日: | 2017-08-25 |
发明(设计)人: | 何锐邦;唐会军 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京智汇东方知识产权代理事务所(普通合伙)11391 | 代理人: | 康正德,范晓斌 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图片 搜索 设备 方法 系统 | ||
1.一种建立图片主题库的设备,包括:
图片源库,配置为存储至少一张图片以及该图片的上下文文本;
图形信息获取器,配置为从所述图片源库中读取图片,对每张图片进行图形特征分析,获取其图形特征信息,并将该图形特征信息转化为图形特征文本;
文本组合器,配置为对于每张图片,将获取的图形特征文本和该图片的上下文文本相组合以生成文本描述,每个文本描述包括多个文本描述词;
主题确定器,配置为根据各图片的文本描述建立至少一个主题,生成图片主题库,其中,每个主题中包括多个与本主题相关的文本描述词,并且确定每个文本描述词所属的主题以及属于该主题的概率,以及与每个图片的文本描述相关联的主题以及与该主题相关联的概率,当接收到搜索词时,确定所述搜索词所属的主题,并将确定的主题中各文本描述词作为最终搜索词进行搜索。
2.根据权利要求1所述的设备,其中,所述主题确定器还配置为使用LDA算法或LSA算法建立各主题。
3.根据权利要求2所述的设备,其中,所述LSA算法为概率潜语义分析PLSA算法。
4.根据权利要求1至3任一项所述的设备,其中,所述文本组合器还配置为:
对任意图片而言,
罗列该图片的图形特征文本以及该图片的上下文文本;
对罗列结果进行排重,将排重后的图形特征文本以及上下文文本要组合,生成所述图片的文本描述。
5.根据权利要求1至3任一项所述的设备,其中,所述上下文文本为html语句。
6.一种图片搜索设备,包括:
信息接收器,配置为接收用户输入的搜索词;
主题转化器,配置为从所述信息接收器获取所述搜索词,并根据主题库来确定该搜索词所属主题及其概率分布,其中,所述主题库中存储有多个主题以及每个主题的概率分布情况,每个主题包括多个与本主题相关的文本描述词,所述搜索词所属主题中的各文本描述词用于作为最终搜索词进行搜索;
图片相似度计算器,配置为根据类似的概率分布来确定与该搜索词所属主题相关的文本描述词,并获取与确定的文本描述词的相似程度超过一定比例的图片;
其中,还包括图片主题库生成器:配置为获取多张图片;分别对每张图片进行处理,获取其图形特征信息和上下文文本;
将图形特征信息转化为图形特征文本,结合该图片的上下文文本以及转化生成的图形特征文本生成该图片的文本描述;
根据各图片的文本描述建立至少一个主题,并确定每个主题的分布情况,生成图片主题库。
7.根据权利要求6所述的设备,其中,还包括:
显示器,配置为显示所述图片相似度计算器确定出的图片。
8.根据权利要求7所述的设备,其中,所述显示器还配置为根据相似程度从高到低显示所述图片相似度计算器确定出的图片。
9.一种图片搜索系统,包括权利要求1至5任一项所述的建立图片主题库的设备,以及权利要求6至8任一项所述的图片搜索设备。
10.一种建立图片主题库的方法,包括:
获取多张图片;
分别对每张图片进行处理,获取其图形特征信息和上下文文本;
将图形特征信息转化为图形特征文本,结合该图片的上下文文本以及转化生成的图形特征文本生成该图片的文本描述;
根据各图片的文本描述建立至少一个主题,并确定每个主题的分布情况,生成图片主题库,其中,每个主题中包括多个与本主题相关的文本描述词,并且确定每个文本描述词所属的主题以及属于该主题的概率,以及与每个图片的文本描述相关联的主题以及与该主题相关联的概率;
当接收到搜索词时,确定所述搜索词所属的主题,并将确定的主题中各文本描述词作为最终搜索词进行搜索。
11.根据权利要求10所述的方法,其中,所述根据各图片的文本描述建立至少一个主题,包括:使用概率潜语义分析PLSA算法建立各主题。
12.根据权利要求10所述的方法,其中,所述根据各图片的文本描述建立至少一个主题,包括:使用LDA算法或LSA算法建立各主题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310492161.2/1.html,转载请声明来源钻瓜专利网。