[发明专利]具有分层存储的索引的搜索引擎有效
申请号: | 200480033085.8 | 申请日: | 2004-11-09 |
公开(公告)号: | CN101189602A | 公开(公告)日: | 2008-05-28 |
发明(设计)人: | 克努特·玛格纳·里斯维克;耶格威·阿舍米;托尔·埃格;哈瓦德·派特森 | 申请(专利权)人: | 奥弗图尔服务公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 | 代理人: | 王怡 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 具有 分层 存储 索引 搜索引擎 | ||
1.一种用于为数据库中的数据项建立索引的方法,所述方法包括:
从数据库中获取数据项;
产生所述数据项的主索引;
基于所述数据项各自的等级将所述数据项映射到至少第一和第二层上;
基于所述映射从所述主索引产生至少第一和第二子索引;以及
将所述至少第一和第二子索引存储在不同的搜索节点中。
2.根据权利要求1所述的方法,其中所述数据库是可以通过万维网得到的网页和文档的集合。
3.根据权利要求1所述的方法,其中所述映射基于所述数据项的静态相关分数。
4.根据权利要求1所述的方法,还包括:
在所述数据库上执行用于大量查询的搜索查询日志;以及
接收所述搜索查询日志的结果;
其中所述第一子索引基于所述查询日志的结果。
5.根据权利要求3所述的方法,还包括:
在所述数据库上执行用于大量查询的搜索查询日志;以及
接收所述搜索查询日志的结果;
其中所述第一子索引基于所述查询日志的结果。
6.根据权利要求1所述的方法,其中所述映射基于所述数据项的价值上下文。
7.根据权利要求1所述的方法,其中所述数据项为web网页并且所述映射基于所述web网页的相关分数。
8.一种用于搜索数据库的方法,所述方法包括:
从数据库中获取数据项;
产生所述数据项的主索引;
基于所述数据项各自的等级将数据项映射到至少第一和第二层上;
基于所述映射从所述主索引产生至少第一和第二子索引;
将所述至少第一和第二子索引存储在不同的搜索节点中;
接收搜索查询;以及
搜索所述第一层以寻找与所述搜索查询有关的结果数据项。
9.根据权利要求8所述的方法,还包括:
当所述第一层不能产生阈值数目的结果数据项时,搜索所述第二层以寻找与所述搜索查询有关的结果数据项。
10.根据权利要求8所述的方法,其中当所述第一层不能产生阈值数目的结果数据项时,搜索所述第二层。
11.一种用于为数据库建立索引的系统,所述系统包括:
采集器,其搜集所述数据库以寻找数据项;
索引器,其接收所述数据项并产生主索引;
文档映射部件,其基于所述数据项各自的等级将所述数据项映射到至少第一和第二层上;
处理器,其基于所述映射从所述主索引产生至少第一和第二子索引;
第一搜索节点,其存储所述第一子索引;以及
第二搜索节点,其存储所述第二子索引。
12.一种用于实现对数据库的搜索的搜索节点组,包括:
逻辑上被排列在多个行和多个列中的多个搜索节点;
所述多个列中任一列中的所有搜索节点实质上包括相同的信息;
所述多个行中任一行中的所有搜索节点包括不同的信息;
所述多个行中的搜索节点逻辑上被分为至少第一和第二层;
所述第一层中的搜索节点包括针对所述数据库的第一部分的索引;以及
所述第二层中的搜索节点包括针对所述数据库的第二部分的索引;其中
所述第一和第二层中的数据基于所述数据库的第一和第二部分中的信息各自的等级。
13.一种搜索引擎,包括:
采集器,其搜集数据库以寻找数据项;
索引器,其接收所述数据项并产生主索引;
文档映射部件,其基于所述数据项各自的等级将所述数据项映射到至少第一和第二层上;
处理器,其基于所述映射从所述主索引产生至少第一和第二子索引;
第一搜索节点,其存储所述第一子索引;
第二搜索节点,其存储所述第二子索引;以及
调度器,其接收查询并且将所述查询转发给所述第一搜索节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于奥弗图尔服务公司,未经奥弗图尔服务公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200480033085.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有可调电极面积比的受约束等离子体
- 下一篇:一种高强度三元氟橡胶的制备方法