[发明专利]面向键值存储系统的索引树构建方法及系统有效
申请号: | 201910271085.X | 申请日: | 2019-04-04 |
公开(公告)号: | CN110083601B | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 韩书楷;蒋德钧;熊劲 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;梁挥 |
地址: | 100080 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 键值 存储系统 索引 构建 方法 系统 | ||
本发明涉及一种面向键值存储系统的索引树构建方法,包括:对键值数据的键值的前缀进行排序和划分以生成字典树,作为索引树的上层结构;以该键值的哈希值构建哈希表,以该哈希表生成该索引树的下层结构;建立键值数据—哈希表—字典树的对应关系,生成该索引树。本发明的索引树构建方法,通过构建的上下层结构的索引树进行键值数据索引操作,有着更优秀的单体操作能力O(L+K),以及更低的空间开销和更高的效率,并支持范围查找和动态处理数据增长。
技术领域
本发明属于计算机存储的键值存储、索引技术领域,具体涉及一种面向键值存储系统的索引树构建的方法和系统。
背景技术
对于一个存储系统而言,如何高效的组织、索引这些数据成为了影响一个存储系统效率优良的关键因素。针对内存索引的设计,现阶段被广泛应用的索引类型主要有以下几种:
1、B+树(B+tree):一个节点可以拥有多于2个子节点的多叉搜索树。它能够存储数据、对其进行排序并允许以O(log n)的时间复杂度运行进行查找、顺序读取、插入和删除的数据结构。B+tree算法普遍运用在数据库和文件系统。发明“一种B+树读缓存方法及相关装置”(公开号:CN109492005A),公开了一种B+树读缓存方法,首先确定当前可用缓存空间的容量,并确定所述容量可以缓存的前N层B+树非叶子节点,将前N层的节点信息全部进行缓存,从而在查找叶子节点时,纵向的每一条路径中,缓存在缓存空间的节点数均是相同的。“数据查询方法和装置”(公开号:CN109299106A),提供一种数据查询方法和装置,包括:接收用户发送的查询指令,查询指令中包括至少一个查询条件;在三级索引文件集合中,确定与至少一个查询条件中的每一个查询条件对应的第一维度值,并确定与第一维度值对应的三级索引信息;在二级索引文件集合中,确定与三级索引信息对应的二级索引信息;根据与第二维度值对应的二级索引信息,在数据库中确定与二级索引信息对应的数据。进而不再需要对数据的键值进行遍历,只依据三级索引信息、二级索引信息,就可以查找到数据库中的数据。
2、哈希表:哈希表作为一种索引结构一直被广泛的运用在各种内存型数据库系统中,它通过哈希函数随机的将数据定址到表的某一槽,在理想情况下操作可以达到O(1)级别的时间复杂度。发明“包括资源有效索引的键值存储系统”(公开号:CN109416694A),描述了一种用于使用资源有效索引来与内容存储库中的键值条目进行交互的键值存储系统。索引提供包括多个散列桶的数据结构。每个散列桶包括散列桶单元的链表。键值存储系统基于其创建时间以分布式方式在存储器中索引存储库与辅助索引存储库之间存储散列桶单元的每个链表中的散列条目。键值存储系统还被配置为按时间顺序存储链接的散列桶单元的特定集合中的散列条目以反映其创建时间。索引还包括影响键值存储系统的性能的各种可调参数。
3、字典树:是一种有序树,用于保存关联数组,其中的键通常是字符串。与二叉查找树不同,键不是直接保存在节点中,而是由节点在树中的位置决定。一个节点的所有子孙都有相同的前缀,也就是这个节点对应的字符串,而根节点对应空字符串。一般情况下,不是所有的节点都有对应的值,只有叶子节点和部分内部节点所对应的键才有相关的值。发明“一种索引数据存储及检索方法、装置及存储介质”(公开号:CN109325032A),提供了一种索引数据存储及检索方法、装置及存储介质,数据存储方法在数据(即键值对)存储时,不仅根据值元素的大小进行排序,还将排序的数据序列划分为多个段,每个段将键值排序,并将数据序列与键值排序对应存储,实现值元素和键值(也称为记录编号)都有序存储,即构建了全新的索引结构,并提出了适于该索引结构的多条件检索方法,其对于任意的区间查询,结果集都可以用一个或者多个集合的并集来表示,并且这些集合大部分有序的,最多边界两个集合是无序的,从而提高了在多个条件查询时进行与、或、非等运算的效率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910271085.X/2.html,转载请声明来源钻瓜专利网。