[发明专利]一种基于布鲁姆过滤器的数据块快速比较系统无效
申请号: | 200910016220.2 | 申请日: | 2009-06-16 |
公开(公告)号: | CN101609449A | 公开(公告)日: | 2009-12-23 |
发明(设计)人: | 王文方 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 布鲁姆 过滤器 数据 快速 比较 系统 | ||
技术领域
本发明涉及一种数据块快速比较技术,具体地说是一种基于布鲁姆过滤器的数据块快速比较系统。
背景技术
在重复数据删除系统中,数据块比较是使用频度最高的操作,因为重复数据删除的最重要的工作就是将数据块与数据池中的所有数据块相比较,以判断其是否已存在于数据池中,若数据块已存在,则可方便的将数据块删除,并保留一个指向数据池中相同数据块的指针,若数据块不存在,则将数据块插入数据池中。
传统的数据块比较方法,一般采用数据块HASH散列标识的方式,即为数据池中的每个数据块都保留一个唯一的HASH散列。比较数据块时先计算数据块的HASH散列标识,然后与数据池中的数据块相比较,以判断数据块是否存在于存储池中。但是这种HASH散列标识查询的复杂度一般是线性的或是对数阶的,也就是说,当数据池的规模增大时,数据块的比较效率也会逐渐降低,在大规模的重复数据删除系统中,这将对系统性能造成极大影响,导致系统运行效率的降低。
因此,如何使用一种数据块的快速比较技术,使数据块的比较效率与数据池的规模无关,提高大规模系统的运行效率,是重复数据删除系统所面临的主要问题。
发明内容
本发明的技术任务是提供一种利用Bloom Filter查询一个数据块是否存在于包含大量数据块的数据池中,将大量的查询比较操作替换为计算操作的一种基于布鲁姆过滤器的数据块快速比较系统。
本发明的技术任务是按以下方式实现的,包括数据块比较接口模块、Bloom Filter数据块比较模块、数据块查询比较模块、Bloom Filter元数据记录模块和数据池元数据记录模块;数据块比较接口模块连接Bloom Filter数据块比较模块,Bloom Filter数据块比较模块连接数据块查询比较模块、Bloom Filter元数据记录模块和数据池元数据记录模块,数据块查询比较模块连接数据池元数据记录模块。
数据块比较接口模块提供数据块比较的访问接口,将传入的待比较的数据块生成数据块标识,并将数据块标识传入Bloom Filter数据比较模块;BloomFilter数据块比较模块负责利用Bloom Filter进行数据块的比较,可调用BloomFilter元数据记录模块,查询相应的Bloom Filter标识是否在Bloom Filter元数据中置位,也可调用数据池元数据记录模块,将数据块标识插入数据池元数据,还可调用数据块查询比较模块,重新进行数据块比较;数据块查询比较模块负责利用数据块标识进行数据块的比较,可调用数据池元数据记录模块,查询数据块标识是否存在于数据池元数据中;Bloom Filter元数据记录模块以数据位的形式存储数据池中各数据块的Bloom Filter标识,提供Bloom Filter标识的查询、添加与删除接口;数据池元数据记录模块存储数据池中各数据块的数据块标识,提供数据块标识的查询、添加与删除接口。
利用Bloom Filter进行待比较数据块与数据池中所有数据块的快速比较,将大量的查询比较操作替换为计算操作,在数据块Bloom Filter标识在BloomFilter元数据中置位的情况下,需要利用查询方式重新对数据块进行比较。
数据块比较流程为:
(1)、数据块比较接口模块提供数据块比较的访问接口,将传入的待比较的数据块生成数据块的唯一HASH散列,作为数据块标识;
(2)、数据块比较接口模块将数据块标识传入Bloom Filter数据比较模块,Bloom Filter数据比较模块通过使用多个HASH函数,生成数据块的多个HASH散列,作为数据块的Bloom Filter标识;
(3)、Bloom Filter数据块比较模块调用Bloom Filter元数据记录模块的接口,查询相应的Bloom Filter标识是否已在Bloom Filter元数据中置位;
(4)、如果未在Bloom Filter元数据置位,则表明数据块不存在于数据池中,则将Bloom Filter标识在Bloom Filter元数据记录模块中置位,并调用数据池元数据记录模块的接口,将数据块标识插入数据池元数据,并返回数据块不存在;
(5)、若已在Bloom Filter元数据中置位,则调用数据块查询比较模块,重新进行数据块比较;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910016220.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:IC卡体质测试系统
- 下一篇:汉字首笔画口型声调三笔输入法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置