[发明专利]基于单哈希均分布隆过滤器的重复数据删除技术实现方法在审
申请号: | 202011024283.5 | 申请日: | 2020-09-25 |
公开(公告)号: | CN112162975A | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 齐德昱;俞快 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/22 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于单哈希均分布隆过滤器的重复数据删除技术实现方法。所述方法首先使用一个分区范围内高要求的哈希函数,其次由k个哈希函数生成k个哈希映射,采用的k个哈希函数是计算量级极低的取模运算,然后再缩放映射到大小相同的分区;已经保存的数据通过计算生成一个单哈希均分布隆过滤器并保存;新数据通过生成新的单哈希均分布隆过滤器,如果映射块不重复则证明新数据不存在。本发明实现了一种基于单哈希均分布隆过滤器的重复数据删除技术实现方法,快速有效的过滤有可能重复的数据。 | ||
搜索关键词: | 基于 单哈希 均分 过滤器 重复 数据 删除 技术 实现 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011024283.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种变压器线圈的自动绕线装置
- 下一篇:一种冲网机上刀架横摆移位器