[发明专利]搜索方法及装置有效
申请号: | 201310586096.X | 申请日: | 2013-11-20 |
公开(公告)号: | CN103559313B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 赵宏威 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙)11276 | 代理人: | 宋菲,刘云贵 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 搜索 方法 装置 | ||
1.一种搜索方法,包括:
获得默认词库;所述默认词库为对抓取的网页内容进行分词处理获得的;所述默认词库包括不同类别的默认词库;
通过脚本文件将保存在日志中的搜索词写入词表;若所述词表中没有所述搜索词,则加入词表;否则,将该所述搜索词的次数加一;
统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将该类别中次数大于预定值的搜索词添加到对应类别的所述默认词库中,获得对应类别的当前词库;
更新当前词库的索引;
接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示。
2.根据权利要求1所述的方法,所述获得默认词库包括:获得不同类别的默认词库;或者
所述统计用户通过客户端发送的各搜索词的次数,将次数大于预定值的搜索词添加到所述默认词库中,获得当前词库,包括:
统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将该类别中次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库。
3.根据权利要求2所述的方法,所述统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库,包括:
利用脚本文件将保存在日志中的搜索词写入词表,并将对应搜索词的次数进行累加处理;
判断搜索词对应的类别;
将次数大于预定值的搜索词保留在所述词表中,将所述词表添加到对应类别的默认词库中,生成对应类别的当前词库,使用对应类别的当前词库替换对应类别的默认词库。
4.根据权利要求3所述的方法,所述词表包括关键词、对应关键词的次数和词库分割行。
5.根据权利要求1所述的方法,所述默认词库为对从互联网上抓取的网页进行解析、提取和过滤处理,然后对处理后的网页内容进行分词处理获得的。
6.一种搜索装置,包括:
获得模块,适于获得默认词库;所述默认词库为对抓取的网页内容进行分词处理获得的;所述默认词库包括不同类别的默认词库;
添加模块,适于统计用户通过客户端发送的各搜索词的次数,判断搜索词对应的类别,将该类别中次数大于预定值的搜索词添加到对应类别的所述默认词库中,获得对应类别的当前词库;
更新模块,适于更新当前词库的索引;
搜索模块,适于接收用户通过客户端发送的搜索词,在当前词库中搜索该搜索词,获得搜索结果,并向所述客户端返回该搜索结果以用于向用户展示;
所述添加模块进一步适于通过脚本文件将保存在日志中的搜索词写入词表;若所述词表中没有所述搜索词,则加入词表;否则,将该所述搜索词的次数加一。
7.根据权利要求6所述的装置,所述获得模块,具体适于获得不同类别的默认词库;或者
所述添加模块,具体适于:统计用户通过客户端发送的各搜索词的次数,将该类别中次数大于预定值的搜索词添加到对应类别的默认词库中,获得对应类别的当前词库。
8.根据权利要求7所述的装置,所述添加模块,具体适于:
利用脚本文件将保存在日志中的搜索词写入词表,并将对应搜索词的次数进行累加处理;将次数大于预定值的搜索词保留在所述词表中,将所述词表添加到对应类别的默认词库中,生成对应类别的当前词库,使用对应类别的当前词库替换对应类别的默认词库。
9.根据权利要求8所述的装置,所述词表包括关键词、对应关键词的次数和词库分割行。
10.根据权利要求6所述的装置,所述默认词库为对从互联网上抓取的网页进行解析、提取和过滤处理,然后对处理后的网页内容进行分词处理获得的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310586096.X/1.html,转载请声明来源钻瓜专利网。