[发明专利]用于文档索引的非频繁字索引无效
申请号: | 200510005929.4 | 申请日: | 2005-01-20 |
公开(公告)号: | CN1648899A | 公开(公告)日: | 2005-08-03 |
发明(设计)人: | D·A·沙基比;M·伯罗斯;G·萨林 | 申请(专利权)人: | 微软公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海专利商标事务所有限公司 | 代理人: | 张政权 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种文档索引系统利用了两种索引。一种非频繁字索引与一种频繁字索引被分开维护,所述非频繁字索引对在所索引的文档中不经常出现的字的位置进行映射。该非频繁字索引可以以与频繁字索引不同的方式进行存储和分隔以提高效率。 | ||
搜索关键词: | 用于 文档 索引 频繁 | ||
【主权项】:
1.用于处理用户查询的搜索引擎的系统,所述系统对含有对应于用户查询的字的文档进行定位,其特征在于,所述系统包括:非频繁字识别器,对小于阈值数目的文档中出现的非频繁字进行识别;频繁字索引,对含有超出阈值数目的文档中出现的字的文档位置进行映射;与频繁字索引分开地进行维护的非频繁字索引,对含有非频繁字的文档位置进行映射;索引扫描部件,响应于含有非频繁字的查询,扫描所述非频繁字索引以找出含有所述非频繁字的文档位置。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200510005929.4/,转载请声明来源钻瓜专利网。
- 上一篇:鱼类基因原位修饰育种的方法
- 下一篇:用于光盘读取写入装置的齿轮传动系统