[发明专利]一种图片搜索的方法和装置有效
申请号: | 201310148051.4 | 申请日: | 2013-04-25 |
公开(公告)号: | CN103226601B | 公开(公告)日: | 2019-03-29 |
发明(设计)人: | 黄际洲 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G06F16/58 | 分类号: | G06F16/58 |
代理公司: | 北京鸿德海业知识产权代理事务所(普通合伙) 11412 | 代理人: | 袁媛 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图片 搜索 方法 装置 | ||
1.一种图片搜索的方法,其特征在于,该方法包括:
线下挖掘阶段,将搜索行为日志中的各query分别作为当前query以执行:
S11、从搜索行为日志中收集当前query以及当前query的相关query,构成当前query的搜索项集合;
S12、将当前query的搜索项集合中表达相同语义的query归一化为一个兴趣点,得到当前query的各兴趣点;
S13、将当前query的各兴趣点存储于兴趣点数据库;
线上搜索阶段:
S21、查询所述兴趣点数据库,确定用户当前输入的query的兴趣点;
S22、获取所述用户当前输入的query的兴趣点的图片搜索结果,在用户当前输入的query的搜索结果页中展现各兴趣点以及各兴趣点的图片搜索结果。
2.根据权利要求1所述的方法,其特征在于,所述当前query的相关query包括:所述当前query的同义query、包含所述当前query的query以及包含所述当前query的同义query的query。
3.根据权利要求1或2所述的方法,其特征在于,所述从搜索行为日志中收集当前query以及当前query的相关query为:
从搜索行为日志中包含所述当前query的会话Session中收集所述当前query以及当前query的相关query。
4.根据权利要求1所述的方法,其特征在于,在所述步骤S12中还包括:依据兴趣点所来源query的搜索次数确定各兴趣点的搜索热度;
在所述步骤S13中进一步将各兴趣点的搜索热度存储于兴趣点数据库;
在所述步骤S22中,在所述搜索结果页中依据各兴趣点的搜索热度对各兴趣点进行排序。
5.根据权利要求1或4所述的方法,其特征在于,在所述步骤S12中还包括:确定所述当前query的各兴趣点所属的分类;
在所述步骤S13中进一步将各兴趣点所属的分类存储于兴趣点数据库;
在所述步骤S22中,在所述搜索结果页中进一步展现各兴趣点所属的分类。
6.根据权利要求5所述的方法,其特征在于,在所述搜索结果页中,依据用户的历史搜索行为和各分类的搜索热度中的至少一种对各分类进行排序;
各分类的搜索热度由分类中各兴趣点所来源的query的搜索次数确定。
7.根据权利要求1所述的方法,其特征在于,在所述步骤S21中确定用户当前输入的query的兴趣点包括:
查询所述兴趣点数据库中是否存在与用户当前输入的query表达相同语义的query,如果是,确定所述兴趣点数据库中与用户当前输入的query表达相同语义的query的兴趣点。
8.根据权利要求1或7所述的方法,其特征在于,确定两个query是否表达相同语义的方式具体为:
将两个query进行分词和去除停用词的处理;
将处理后的两个query进行比对,如果一个query比另一个query多出的部分为语义冗余短语,则认为这两个query表达相同语义,或者如果两个query中不同部分是同义词,则认为这两个query表达相同语义。
9.根据权利要求7所述的方法,其特征在于,如果所述兴趣点数据库中不存在与用户当前输入的query表达相同语义的query,则查询所述兴趣点数据库中是否存在与用户当前输入的query表达相同语义的兴趣点,如果是,转至执行步骤S23;
S23、获取所述与用户当前输入的query表达相同语义的兴趣点的图片搜索结果并展现于所述用户当前输入的query的搜索结果页中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310148051.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型复式连接的USB连接线
- 下一篇:一种具有弹性性能的压力传感器