[发明专利]一种获取具有对比效果的图片搜索结果的方法及装置有效
申请号: | 201310319339.3 | 申请日: | 2013-07-26 |
公开(公告)号: | CN103455550A | 公开(公告)日: | 2013-12-18 |
发明(设计)人: | 黄际洲 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 获取 具有 对比 效果 图片 搜索 结果 方法 装置 | ||
1.一种获取具有对比效果的图片搜索结果的方法,包括:
A.利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;
B.利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;
C.确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;
D.当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。
2.根据权利要求1所述的方法,其特征在于,所述步骤A包括:
从搜索日志中提取包含种子中心词及种子限定词的历史搜索词;
将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。
3.根据权利要求2所述的方法,其特征在于,所述步骤B包括:
针对搜索日志的历史搜索词中与模板槽匹配的中心词,根据该中心词匹配到的各个关键词模板的置信度之和确定该中心词的歧义分值,其中一个关键词模板的置信度等于该关键词模板的模板槽匹配的相异种子中心词个数与预设的种子中心词总数之比;
将歧义分值超过预设第一阈值的中心词确定为具有一个以上搜索需求的歧义词。
4.根据权利要求1所述的方法,其特征在于,所述步骤C包括:
以会话为单位对搜索日志进行切分;
当切分得到的同一个会话中存在一个搜索动作包含歧义词,且另一搜索动作不仅包含该歧义词,还包括设定类别词时,将所述设定类别词作为该歧义词相关联的候选需求词;
计算歧义词的候选需求词的需求热度,并将需求热度高于预设第二阈值的候选需求词作为最终的需求词。
5.根据权利要求4所述的方法,其特征在于,所述步骤D在对各类图片搜索结果对比展示时,根据匹配词相关联的需求词的需求热度,确定各类图片搜索结果的排列顺序。
6.一种获取具有对比效果的图片搜索结果的装置,包括:
模板挖掘单元,用于利用预设的种子词从搜索日志中挖掘关键词模板,其中所述种子词包括种子中心词及种子限定词,所述种子中心词在相同类目下反映一个以上的搜索需求,所述种子限定词决定所述相同类目的范围;
歧义词挖掘单元,用于利用所述关键词模板从搜索日志中确定具有一个以上搜索需求的歧义词;
需求词挖掘单元,用于确定所述歧义词相关联的需求词,其中一个相关联的需求词对应歧义词的一个搜索需求;
展示单元,用于当用户输入的关键词与所述歧义词匹配时,将匹配词相关联的各个需求词分别与匹配词组合为搜索词进行图片搜索,以获取匹配词相关联的各类图片搜索结果,并将各类图片搜索结果对比展示,其中一类图片搜索结果对应一个搜索需求。
7.根据权利要求6所述的装置,其特征在于,所述模板挖掘单元包括:
提取子单元,用于从搜索日志中提取包含种子中心词及种子限定词的历史搜索词;
泛化子单元,用于将提取的历史搜索词中包含的种子中心词泛化为模板槽,以得到关键词模板。
8.根据权利要求7所述的装置,其特征在于,所述歧义词挖掘单元包括:
计算子单元,用于针对搜索日志的历史搜索词中与模板槽匹配的中心词,根据该中心词匹配到的各个关键词模板的置信度之和确定该中心词的歧义分值,其中一个关键词模板的置信度等于该关键词模板的模板槽匹配的相异种子中心词个数与预设的种子中心词总数之比;
歧义词确定子单元,用于将歧义分值超过预设第一阈值的中心词确定为具有一个以上搜索需求的歧义词。
9.根据权利要求6所述的装置,其特征在于,所述需求词挖掘单元包括:
切分子单元,用于以会话为单位对搜索日志进行切分;
候选需求词确定子单元,用于当切分得到的同一个会话中存在一个搜索动作包含歧义词,且另一搜索动作不仅包含该歧义词,还包括设定类别词时,将所述设定类别词作为该歧义词相关联的候选需求词;
最终需求词确定子单元,用于计算歧义词的候选需求词的需求热度,并将需求热度高于预设第二阈值的候选需求词作为最终的需求词。
10.根据权利要求9所述的装置,其特征在于,所述展示单元在对各类图片搜索结果对比展示时,根据匹配词相关联的需求词的需求热度,确定各类图片搜索结果的排列顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310319339.3/1.html,转载请声明来源钻瓜专利网。