[发明专利]一种获取具有对比效果的图片搜索结果的方法及装置有效
申请号: | 201310319339.3 | 申请日: | 2013-07-26 |
公开(公告)号: | CN103455550A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 黄际洲 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 具有 对比 效果 图片 搜索 结果 方法 装置 | ||
【技术领域】
本发明涉及图片搜索技术,特别涉及一种获取具有对比效果的图片搜索结果的方法和装置。
【背景技术】
目前的图片搜索引擎根据用户输入的关键词,查找图片周围文本中包含该关键词的图片作为搜索结果返回给用户,如果用户输入的关键词反映多个搜索需求,现有的图片搜索引擎将对此无法判断,其返回的结果很可能只反映其中的一个搜索需求,如果该搜索需求正好不符合用户的意图,则用户可能需要经过多次搜索,才能获得自己满意的图片。
请参考图1,图1是现有的图片搜索引擎用户搜索“东方不败”时的返回结果。假设用户在搜索“东方不败”时,由演员“陈乔恩”扮演的“东方不败”正处于电视台的热播阶段,则用户得到的图片搜索结果就很可能如图1所示,即用户在搜索结果中很可能只能得到“陈乔恩”扮演的“东方不败”这一种搜索需求的结果。但事实上用户搜索“东方不败”有可能想要演员“林青霞”扮演的结果,又或者用户搜索“东方不败”时,并不是想得到特定演员扮演的结果,而是希望分别得到不同演员扮演的结果。
【发明内容】
本发明所要解决的技术问题是提供一种获取具有对比效果的图片搜索结果的方法及装置,以解决现有的图片搜索引擎不能根据用户的搜索需求返回全面的搜索结果的问题。
本发明为解决技术问题而采用的技术方案是提供一种获取具有对比效果的图片搜索结果的方法,包括:利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。
根据本发明之一优选实施例,所述步骤A包括:从搜索日志中提取包含种子中心词及种子限定词的历史搜索词;将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。
根据本发明之一优选实施例,所述步骤B包括:针对搜索日志的历史搜索词中与模板槽匹配的中心词,根据该中心词匹配到的各个关键词模板的置信度之和确定该中心词的歧义分值,其中一个关键词模板的置信度等于该关键词模板的模板槽匹配的相异种子中心词个数与预设的种子中心词总数之比;将歧义分值超过预设第一阈值的中心词确定为具有一个以上搜索需求的歧义词。
根据本发明之一优选实施例,所述步骤C包括:以会话为单位对搜索日志进行切分;当切分得到的同一个会话中存在一个搜索动作包含歧义词,且另一搜索动作不仅包含该歧义词,还包括设定类别词时,将所述设定类别词作为该歧义词相关联的候选需求词;计算歧义词的候选需求词的需求热度,并将需求热度高于预设第二阈值的候选需求词作为最终的需求词。
根据本发明之一优选实施例,所述步骤D在对各类图片搜索结果对比展示时,根据匹配词相关联的需求词的需求热度,确定各类图片搜索结果的排列顺序。
本发明还提供了一种获取具有对比效果的图片搜索结果的装置,包括:模板挖掘单元,用于利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;歧义词挖掘单元,用于利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;需求词挖掘单元,用于确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;展示单元,用于当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。
根据本发明之一优选实施例,所述模板挖掘单元包括:提取子单元,用于从搜索日志中提取包含种子中心词及种子限定词的历史搜索词;泛化子单元,用于将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310319339.3/2.html,转载请声明来源钻瓜专利网。