[发明专利]用于记号空间资料库的多级查询处理系统与方法有效
申请号: | 201110121210.2 | 申请日: | 2005-08-08 |
公开(公告)号: | CN102142038A | 公开(公告)日: | 2011-08-03 |
发明(设计)人: | 杰弗里.A.迪安;保罗.G.哈尔;奥尔坎.瑟齐诺格鲁;阿米塔布.K.辛加尔 | 申请(专利权)人: | 谷歌股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种用于在多级查询处理系统中处理查询的方法,所述方法包括:响应于一个或多个查询项从索引中检索第一文档标识符集合;针对相应于第一文档标识符集合的至少一个子集的第一压缩文档集合,生成相关性得分的第一集合;针对第一压缩文档集合中的文档,生成相关性得分的第二集合;读取相关性得分的第一集合和第二集合,生成文档的有序列表用于进一步处理;从所述文档的有序列表中的文档自动地生成附加查询项;使用所述附加查询项制定新查询;处理所述新查询,以从所述索引检索第二文档标识符集合,并且至少部分基于所述附加查询项生成相关性得分的第三集合;以及使用所述相关性得分的第三集合来选择用于呈现给用户的顶部文档的集合。 | ||
搜索关键词: | 用于 记号 空间 资料库 多级 查询 处理 系统 方法 | ||
【主权项】:
一种用于在多级查询处理系统中处理查询的方法,所述多级查询处理系统具有一个或多个处理器以及用于存储一个或多个程序的存储器,所述一个或多个程序由所述一个或多个处理器运行以执行所述方法,所述方法包括:由所述一个或多个处理器执行查询的第一级处理,包括:响应于一个或多个查询项,由所述一个或多个处理器从索引中检索第一文档标识符集合;针对相应于第一文档标识符集合的至少一个子集的第一压缩文档集合,基于查询项的存在、项频度和文档流行性中的一个或多个,由所述一个或多个处理器生成相关性得分的第一集合,并且将相关性得分的第一集合存储在存储器中;由所述一个或多个处理器执行查询的第二级处理,包括:针对第一压缩文档集合中的文档,基于记号位置的列表、文档中的查询项之间的距离、文档中的记号的属性以及出现在第一文档集合的文档中使用的查询项周围的文本中的一个或多个,由所述一个或多个处理器生成相关性得分的第二集合,并且将相关性得分的第二集合存储在存储器中;由所述一个或多个处理器从存储器读取相关性得分的第一集合和第二集合,并且基于相关性得分的第一集合和第二集合生成文档的有序列表用于进一步处理;由所述一个或多个处理器从所述文档的有序列表中的文档自动地生成附加查询项;由所述一个或多个处理器使用所述附加查询项,制定新查询;由所述一个或多个处理器处理所述新查询,以从所述索引检索第二文档标识符集合,并且至少部分基于所述附加查询项生成相关性得分的第三集合;以及由所述一个或多个处理器使用所述相关性得分的第三集合来选择用于呈现给用户的顶部文档的集合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌股份有限公司,未经谷歌股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110121210.2/,转载请声明来源钻瓜专利网。