[发明专利]检索装置和检索方法有效
申请号: | 201110319549.3 | 申请日: | 2011-10-20 |
公开(公告)号: | CN103064841A | 公开(公告)日: | 2013-04-24 |
发明(设计)人: | 张宏利;秦飞;郭永福;陈沛 | 申请(专利权)人: | 北京中搜网络技术股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市盈科律师事务所 11344 | 代理人: | 赵成伟 |
地址: | 100191 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 检索 装置 方法 | ||
1.一种检索装置,其特征在于,包括:
分段模块,对已创建的倒排索引进行分段;
查询模块,查询出用于检索的多个关键词对应的多个倒排索引;
划分模块,根据所述多个倒排索引的分段情况,将所述多个倒排索引划分为多个部分;
并发检索模块,根据所述多个关键词,同时对所述多个部分的倒排索引进行检索,以从所述多个部分的倒排索引中分别得到作为检索结果的倒排索引;
结果生成模块,根据所有作为检索结果的倒排索引,取得作为最终检索结果的倒排索引,并取得对应的文档。
2.根据权利要求1所述的检索装置,其特征在于,还包括:
排序模块,将所述所有倒排索引按自然序进行排序。
3.根据权利要求1所述的检索装置,其特征在于,所述划分模块还根据所述多个部分的倒排索引,确定待使用的多个检索线程;
所述并发检索模块还使用所述多个检索线程,同时对所述多个部分的倒排索引进行检索操作。
4.根据权利要求1至3中任一项所述的检索装置,其特征在于,所述划分模块还根据所述倒排索引中的关键词的数量,对所述多个倒排索引进行划分。
5.一种检索方法,其特征在于,包括:
步骤202,分段模块对已创建的倒排索引进行分段;
步骤204,查询模块查询出用于检索的多个关键词对应的多个倒排索引;
步骤206,划分模块根据所述多个倒排索引的分段情况,将所述多个倒排索引划分为多个部分;
步骤208,并发检索模块根据所述多个关键词,同时对所述多个部分的倒排索引进行检索,以从所述多个部分的倒排索引中分别得到作为检索结果的倒排索引;
步骤210,结果生成模块根据所有作为检索结果的倒排索引,取得作为最终检索结果的倒排索引,并取得对应的文档。
6.根据权利要求5所述的检索方法,其特征在于,在所述步骤202之前,还包括:
排序模块将所述所有倒排索引按自然序进行排序。
7.根据权利要求5所述的检索方法,其特征在于,所述步骤208具体包括:
所述并发检索模块在所述多个部分中每部分的倒排索引中,对命中所述多个关键词的倒排索引进行相关度计算,根据计算得到的相关度的高低顺序,来选出作为所述检索结果的倒排索引。
8.根据权利要求7所述的检索方法,其特征在于,所述步骤210具体包括:
所述结果生成模块根据所有作为所述检索结果的倒排索引所对应的相关度的高低顺序,来选出作为所述最终检索结果的倒排索引。
9.根据权利要求4所述的检索方法,其特征在于,在所述步骤206中,还包括:
所述划分模块根据所述多个部分的倒排索引,确定待使用的多个检索线程;
在所述步骤208中,还包括:
所述并发检索模块使用所述多个检索线程,同时对所述多个部分的倒排索引进行检索操作。
10.根据权利要求4至9中任一项所述的检索方法,其特征在于,在所述步骤206中,所述划分模块还根据所述倒排索引中的关键词的数量,对所述多个倒排索引进行划分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中搜网络技术股份有限公司,未经北京中搜网络技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110319549.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种网页质量数据获取方法和系统
- 下一篇:一种Pdf全文在线检索方法