[发明专利]一种面向海量数据检索的多级桶哈希索引方法有效

专利信息
申请号: 200910256103.3 申请日: 2009-12-29
公开(公告)号: CN101782922A 公开(公告)日: 2010-07-21
发明(设计)人: 王希常;马磊;刘江 申请(专利权)人: 山东山大鸥玛软件有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 济南金迪知识产权代理有限公司 37219 代理人: 王绪银
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要: 一种面向海量数据检索的多级桶哈希索引方法,涉及海量数据存储领域。其特征在于:(1)提供桶映射表,用于减小哈希索引文件在磁盘上的占用空间(2)哈希索引采用了多级桶,磁盘块的大小是扇区大小的整数倍,每个磁盘块有一个或多个基本桶,可以有块内溢出桶,具有全局溢出桶(3)提供索引文件的数据缓存结构,提供了数据缓存映射表,数据缓存的管理使用缓存映射表上的双向链表实现。本发明通过映射表减小索引文件在磁盘上的占用空间,磁盘块是磁盘扇区大小的整数倍,并通过数据缓存结构减少了磁盘读写次数,提高了内存利用效率和数据的检索效率。
搜索关键词: 一种 面向 海量 数据 检索 多级 桶哈希 索引 方法
【主权项】:
一种面向海量数据检索的多级桶哈希索引方法,其特征在于,方法包括哈希索引的创建方法和检索方法,哈希索引的创建方法如下:1)对创建索引的信息确定一个关键字;2)在计算机内存中建立索引桶的映射表,即关键字的哈希值h和索引桶在磁盘上的存储位置c;3)判断索引桶是否在磁盘上,即判断存储位置的值是否等于8个字节的最大值;如果等于8个字节的最大值,说明磁盘上没有已存储的索引桶,继续步骤4);如果不等于8个字节的最大值,说明磁盘上已有已存储的索引桶,转步骤(7);4)磁盘上没有已存储的索引桶时,在磁盘上创建一个新的磁盘块d并存储信息,建立一个新的索引桶,确定新的索引桶在磁盘块d内的序号;5)更新映射表,使c=d;6)更新磁盘,反复存储;7)磁盘上已有已存储的索引桶时,确定该索引桶在磁盘块内的序号;8)判断该索引桶是否有足够的空间存储新的关键字,如果有足够的空间,转步骤(6);如果没有足够的空间,关键字在该索引桶溢出,存储到磁盘块内溢出桶;如果磁盘块内溢出桶也没有足够的空间,关键字在磁盘块内溢出桶溢出,存储到全局溢出桶。哈希索引的检索方法如下:1)对待检索索引的信息确定一个关键字;2)读映射表;3)判断待检索索引桶是否在磁盘上,即判断存储位置的值是否等于8个字节的最大值;如果等于8个字节的最大值,说明磁盘上没有已存储的待检索索引桶,检索结束;如果不等于8个字节的最大值,说明磁盘上已有已存储的待检索索引桶,转步骤(4);4)如果不等于8个字节的最大值,从映射表内获取待检索索引桶号和该索引桶所在磁盘块的磁盘块号;5)桶内检索,如果检索到,则检索结束;如果检索不到,在磁盘块内溢出桶检索;6)在磁盘块内溢出桶检索到,检索结束;如果在磁盘块内溢出桶检索不到,则在全局溢出桶检索,检索结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东山大鸥玛软件有限公司,未经山东山大鸥玛软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/200910256103.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top