[发明专利]基于Cuckoo哈希计算的数据存储优化方法及系统有效
申请号: | 201710415853.5 | 申请日: | 2017-06-06 |
公开(公告)号: | CN107256130B | 公开(公告)日: | 2019-09-24 |
发明(设计)人: | 华宇;孙园园;冯丹 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F3/06 | 分类号: | G06F3/06 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 廖盈春;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Cuckoo哈希计算的数据存储优化方法及系统,首先将索引表中每个桶看作一个子图节点,将表中存储的每个元素看作一条边,并从其实际存储位置指向元素的候选位置,因此整个索引表成为包含多个连通子图的有向图;然后在元素实际插入前通过哈希计算识别其所属的一个或两个子图;再根据子图状态预测插入结果;最后根据预测结果执行插入操作或者直接存入临时空间。本发明利用Cuckoo哈希机制将海量数据扁平化哈希到整个索引表中,合理解决集合内数据的哈希冲突,在保证查询效率的情况下使负载均衡,有效提高索引表利用率,并提前预测数据插入结果;通过对数据存储前预测结果来避免无效的踢出开销,提高了数据存储效率。 | ||
搜索关键词: | 基于 cuckoo 计算 数据 存储 优化 方法 系统 | ||
【主权项】:
1.一种基于Cuckoo哈希计算的数据存储优化方法,其特征在于,包括以下步骤:S1、根据元素属性随机选择两个相互独立的哈希函数计算得到元素在索引表中对应的两个候选哈希桶;S2、根据元素所对应的两个候选哈希桶是否属于cuckoo图,对元素进行分类,其中,v+0类表示元素所对应的两个候选哈希桶都在cuckoo图中,插入元素不会造成cuckoo图节点数增加;v+1类表示元素所对应的两个候选哈希桶只有一个存在于cuckoo图中,插入元素会使cuckoo图节点数加1;v+2类表示元素所对应的两个候选桶之前都没有被加入cuckoo图中,插入元素会使cuckoo图节点数加2;S3、对于cuckoo图中的每个子图,若插入元素后子图中的边数等于节点数,则该子图有且只有一个回路,并将该子图称为满载子图;若插入元素后子图中的边数不等于节点数,则将该子图称为非满载子图,其中,在cuckoo图中,将索引表中每个桶看作是图的一个节点,将索引表中每个元素看作是图的一条边;S4、若元素的两个候选哈希桶对应的两个节点所属的子图为满载子图,则在元素插入导致的踢出路径会形成回路导致无限循环,预测插入操作一定失败;若元素的两个候选哈希桶对应的两个节点所属的子图中有非满载子图,则在非满载子图中一定存在一个空位,经过有限次踢出操作时,所有元素都将插入索引表中,预测插入操作一定成功,其中,两个候选哈希桶对应的两个节点属于相同子图或者两个候选哈希桶对应的两个节点属于不同子图;S5、若预测插入操作失败,则将元素存入临时空间,不进行任何踢出操作;若预测插入操作成功,则根据Cuckoo哈希机制执行元素插入操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710415853.5/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置