[发明专利]基于范围简图的有序链表快速查询方法和装置有效
申请号: | 202110035396.3 | 申请日: | 2021-01-12 |
公开(公告)号: | CN112632087B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 赵义凯;杨仝 | 申请(专利权)人: | 北京大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/2455 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 范围 简图 有序 快速 查询 方法 装置 | ||
1.一种基于Range Sketch的有序链表快速查询方法,其特征在于,包括以下步骤:
将有序链表切分为多个首尾相连的链表段,每一个链表段包含常数个结点,并建立数据结构以记录每一个链表段的信息;
在查询一个特定的键值所对应的结点时,判断该对应的结点在有序链表中所属的特定链表段,顺序地搜索该特定链表段上的结点并依次判断其键值和待查询的键值是否相等;
采用桶数组Buckets Array维护有序链表的每一个链表段的信息;Buckets Array是一个由多个桶组成的数组,桶的数量和有序链表被切分成的链表段的数量相等,第k个桶维护第k个链表段的信息;
采用范围简图Range Sketch判断待查询的键值所对应的结点在有序链表中所属的特定链表段;Range Sketch是一个由多个单元组成的数组,其功能是维护每一个键值对应的结点可能属于哪些桶。
2.根据权利要求1所述的方法,其特征在于,每一个桶包含三个域,分别是:
最小键值min,记录桶对应的链表段中所有结点的键值的最小值,即链表段第一个结点的键值;
最大键值max,记录桶对应的链表段中所有结点的键值的最大值,即链表段最后一个结点的键值;
段首地址address,记录桶对应的链表段的起始地址,即链表段第一个结点的地址。
3.根据权利要求1所述的方法,其特征在于,Range Sketch含有d个相互独立的哈希函数,每一个哈希函数将一个键值随机地映射到一个单元内;每一个单元包含两个域即下界LB和上界UB,分别记录被映射到该单元的键值对应的结点所属的桶的编号的最小值和最大值;当对有序链表切分完并建立Buckets Array之后,将有序链表中的每一个结点和其所属的桶的编号插入到Range Sketch中。
4.根据权利要求3所述的方法,其特征在于,所述将有序链表中的每一个结点和其所属的桶的编号插入到Range Sketch中,包括:
通过结点的键值和d个哈希函数在Range Sketch中定位d个单元;
对于每一个单元,将其记录的LB修改为LB和该结点所属的桶的编号中的较小值,将其记录的UB修改为UB和该结点所属的桶的编号中的较大值。
5.根据权利要求4所述的方法,其特征在于,采用以下步骤查询一个给定的键值在有序链表中对应的结点:
根据该键值和Range Sketch的d个哈希函数定位d个单元,在每一个单元中根据其记录的LB和UB得到一个桶的编号的范围,将得到的d个范围求交集;
如果求得的交集是空集,那么返回有序链表中没有待查询键值对应的结点;如果求得的交集不是空集,那么依次遍历编号在该交集内的桶,并判断是否存在一个桶,其记录的min小于等于待查询的键值而其记录的max大于等于待查询的键值;
如果不存在这样一个桶,那么返回有序链表中没有待查询键值对应的结点;否则会存在唯一一个符合要求的桶,通过该桶记录的address得到对应的链表段的第一个结点的地址,并依次访问链表段上的每一个结点,直到某个结点的键值等于待查询的键值或者等于该桶记录的max;
如果找到了某个结点的键值等于待查询的键值,那么返回这个结点的地址作为当前的查询的答案,否则返回有序链表中没有待查询键值对应的结点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110035396.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种园林施工用便携式小植株移栽器
- 下一篇:一种防堵塞自清洁的注塑射胶设备