[发明专利]用于记号空间资料库的多级查询处理系统与方法有效
申请号: | 201110121210.2 | 申请日: | 2005-08-08 |
公开(公告)号: | CN102142038A | 公开(公告)日: | 2011-08-03 |
发明(设计)人: | 杰弗里.A.迪安;保罗.G.哈尔;奥尔坎.瑟齐诺格鲁;阿米塔布.K.辛加尔 | 申请(专利权)人: | 谷歌股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 记号 空间 资料库 多级 查询 处理 系统 方法 | ||
1.一种用于在多级查询处理系统中处理查询的方法,所述多级查询处理系统具有一个或多个处理器以及用于存储一个或多个程序的存储器,所述一个或多个程序由所述一个或多个处理器运行以执行所述方法,所述方法包括:
由所述一个或多个处理器执行查询的第一级处理,包括:
响应于一个或多个查询项,由所述一个或多个处理器从索引中检索第一文档标识符集合;
针对相应于第一文档标识符集合的至少一个子集的第一压缩文档集合,基于查询项的存在、项频度和文档流行性中的一个或多个,由所述一个或多个处理器生成相关性得分的第一集合,并且将相关性得分的第一集合存储在存储器中;
由所述一个或多个处理器执行查询的第二级处理,包括:
针对第一压缩文档集合中的文档,基于记号位置的列表、文档中的查询项之间的距离、文档中的记号的属性以及出现在第一文档集合的文档中使用的查询项周围的文本中的一个或多个,由所述一个或多个处理器生成相关性得分的第二集合,并且将相关性得分的第二集合存储在存储器中;
由所述一个或多个处理器从存储器读取相关性得分的第一集合和第二集合,并且基于相关性得分的第一集合和第二集合生成文档的有序列表用于进一步处理;
由所述一个或多个处理器从所述文档的有序列表中的文档自动地生成附加查询项;
由所述一个或多个处理器使用所述附加查询项,制定新查询;
由所述一个或多个处理器处理所述新查询,以从所述索引检索第二文档标识符集合,并且至少部分基于所述附加查询项生成相关性得分的第三集合;以及
由所述一个或多个处理器使用所述相关性得分的第三集合来选择用于呈现给用户的顶部文档的集合。
2.根据权利要求1所述的方法,其中,所述相关性得分的第二集合至少基于文档中的记号的属性,其中所述属性包括文档中的记号的字体属性。
3.根据权利要求1所述的方法,还包括:由所述一个或多个处理器解压缩第一压缩文档集合的至少一部分,以恢复第一记号集合,其中,所恢复的第一记号集合与相应于第一文档标识符集合的第一压缩文档集合中的位置相关联。
4.根据权利要求3所述的方法,还包括:
由所述一个或多个处理器使用所恢复的第一记号集合,重构第一压缩文档集合的一个或多个部分。
5.根据权利要求4所述的方法,还包括:
由所述一个或多个处理器把所重构的部分在顶部文档的集合的有序列表中呈现给用户。
6.根据权利要求1所述的方法,其中,所述相关性得分的第三集合基于:在相应于第二文档标识符集合的所述压缩文档集合中的查询项的一个或多个位置。
7.根据权利要求1所述的方法,其中,所述第一文档标识符集合相应于与存储压缩文档集合的记号空间资料库中的查询项相应的记号的部位。
8.根据权利要求1所述的方法,其中,所述检索第一文档标识符集合包括:针对一个或多个查询项使用所述索引来产生记号位置的列表,并且访问映射来产生相应于所述记号位置的文档标识符集合。
9.一种多级查询处理系统,包括:
响应于一个或多个查询项,从索引中检索第一文档标识符集合的部件;
针对相应于第一文档标识符集合的至少一个子集的第一压缩文档集合,基于查询项的存在、项频度和文档流行性中的一个或多个,生成相关性得分的第一集合,并且将相关性得分的第一集合存储在存储器中的部件;
执行查询的第二级处理的部件,包括:
针对第一压缩文档集合中的文档,基于记号位置的列表、文档中的查询项之间的距离、文档中的记号的属性以及出现在第一文档集合的文档中使用的查询项周围的文本中的一个或多个,生成相关性得分的第二集合,并且将相关性得分的第二集合存储在存储器中的部件;
从存储器读取相关性得分的第一集合和第二集合,并且基于相关性得分的第一集合和第二集合生成文档的有序列表用于进一步处理的部件;
从所述文档的有序列表中的文档自动地生成附加查询项的部件;
使用所述附加查询项制定新查询的部件;
处理所述新查询,以从所述索引检索第二文档标识符集合,并且至少部分基于所述附加查询项生成相关性得分的第三集合的部件;以及
使用所述相关性得分的第三集合来选择用于呈现给用户的顶部文档的集合的部件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌股份有限公司,未经谷歌股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110121210.2/1.html,转载请声明来源钻瓜专利网。