[发明专利]一种基于布鲁姆过滤器的数据块快速比较系统无效

专利信息
申请号: 200910016220.2 申请日: 2009-06-16
公开(公告)号: CN101609449A 公开(公告)日: 2009-12-23
发明(设计)人: 王文方 申请(专利权)人: 浪潮电子信息产业股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 250014山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 布鲁姆 过滤器 数据 快速 比较 系统
【说明书】:

技术领域

发明涉及一种数据块快速比较技术,具体地说是一种基于布鲁姆过滤器的数据块快速比较系统。

背景技术

在重复数据删除系统中,数据块比较是使用频度最高的操作,因为重复数据删除的最重要的工作就是将数据块与数据池中的所有数据块相比较,以判断其是否已存在于数据池中,若数据块已存在,则可方便的将数据块删除,并保留一个指向数据池中相同数据块的指针,若数据块不存在,则将数据块插入数据池中。

传统的数据块比较方法,一般采用数据块HASH散列标识的方式,即为数据池中的每个数据块都保留一个唯一的HASH散列。比较数据块时先计算数据块的HASH散列标识,然后与数据池中的数据块相比较,以判断数据块是否存在于存储池中。但是这种HASH散列标识查询的复杂度一般是线性的或是对数阶的,也就是说,当数据池的规模增大时,数据块的比较效率也会逐渐降低,在大规模的重复数据删除系统中,这将对系统性能造成极大影响,导致系统运行效率的降低。

因此,如何使用一种数据块的快速比较技术,使数据块的比较效率与数据池的规模无关,提高大规模系统的运行效率,是重复数据删除系统所面临的主要问题。

发明内容

本发明的技术任务是提供一种利用Bloom Filter查询一个数据块是否存在于包含大量数据块的数据池中,将大量的查询比较操作替换为计算操作的一种基于布鲁姆过滤器的数据块快速比较系统。

本发明的技术任务是按以下方式实现的,包括数据块比较接口模块、Bloom Filter数据块比较模块、数据块查询比较模块、Bloom Filter元数据记录模块和数据池元数据记录模块;数据块比较接口模块连接Bloom Filter数据块比较模块,Bloom Filter数据块比较模块连接数据块查询比较模块、Bloom Filter元数据记录模块和数据池元数据记录模块,数据块查询比较模块连接数据池元数据记录模块。

数据块比较接口模块提供数据块比较的访问接口,将传入的待比较的数据块生成数据块标识,并将数据块标识传入Bloom Filter数据比较模块;BloomFilter数据块比较模块负责利用Bloom Filter进行数据块的比较,可调用BloomFilter元数据记录模块,查询相应的Bloom Filter标识是否在Bloom Filter元数据中置位,也可调用数据池元数据记录模块,将数据块标识插入数据池元数据,还可调用数据块查询比较模块,重新进行数据块比较;数据块查询比较模块负责利用数据块标识进行数据块的比较,可调用数据池元数据记录模块,查询数据块标识是否存在于数据池元数据中;Bloom Filter元数据记录模块以数据位的形式存储数据池中各数据块的Bloom Filter标识,提供Bloom Filter标识的查询、添加与删除接口;数据池元数据记录模块存储数据池中各数据块的数据块标识,提供数据块标识的查询、添加与删除接口。

利用Bloom Filter进行待比较数据块与数据池中所有数据块的快速比较,将大量的查询比较操作替换为计算操作,在数据块Bloom Filter标识在BloomFilter元数据中置位的情况下,需要利用查询方式重新对数据块进行比较。

数据块比较流程为:

(1)、数据块比较接口模块提供数据块比较的访问接口,将传入的待比较的数据块生成数据块的唯一HASH散列,作为数据块标识;

(2)、数据块比较接口模块将数据块标识传入Bloom Filter数据比较模块,Bloom Filter数据比较模块通过使用多个HASH函数,生成数据块的多个HASH散列,作为数据块的Bloom Filter标识;

(3)、Bloom Filter数据块比较模块调用Bloom Filter元数据记录模块的接口,查询相应的Bloom Filter标识是否已在Bloom Filter元数据中置位;

(4)、如果未在Bloom Filter元数据置位,则表明数据块不存在于数据池中,则将Bloom Filter标识在Bloom Filter元数据记录模块中置位,并调用数据池元数据记录模块的接口,将数据块标识插入数据池元数据,并返回数据块不存在;

(5)、若已在Bloom Filter元数据中置位,则调用数据块查询比较模块,重新进行数据块比较;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200910016220.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top