[发明专利]一种索引结构建立方法、装置、设备及存储介质在审
申请号: | 202110597931.4 | 申请日: | 2021-05-31 |
公开(公告)号: | CN113190645A | 公开(公告)日: | 2021-07-30 |
发明(设计)人: | 姚黎明;高灵超;任英杰;杨智伟;任小伟;盛爽;陈屹婷;吕宏伟;何小芸;郑菲 | 申请(专利权)人: | 国家电网有限公司大数据中心 |
主分类号: | G06F16/31 | 分类号: | G06F16/31;G06F16/36;G06F16/33 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 索引 结构 建立 方法 装置 设备 存储 介质 | ||
本发明公开了一种索引结构建立方法、装置、设备及存储介质。该方法包括:获取电力数据的数据属性和属性值;根据所述数据属性、所述属性值以及所述数据属性和所述属性值之间的关联关系,建立用于关联检索的上层B+树索引结构和下层索引结构,其中,所述上层B+树索引结构中的每个叶子节点中存储有关键字和叶子节点与下层索引节点和/或子图的链接信息,通过本发明的技术方案,能够实现能够针对电力数据的特点,构建双层索引结构,既能够解决跨数据范围检索的问题,又能对无序数据进行检索。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种索引结构建立方法、装置、设备及存储介质。
背景技术
针对字符型和数值型数据传统的数据检索方法主要分为以下两种:倒排索引和B+树的索引结构检索。倒排索引结构对字符型数据的检索具有良好的性能,但它对赋有权值的索引词没有提供一种好的处理方法,且不能满足数值型数据跨数据范围的检索需求。B+树实质上是一种多叉树,通过子节点可以有效地存储数据信息,由于叶子节点的有序性保证了它对有序性数值型数据检索具有优势,但是,B+树不适合字符型数据检索。
随着“数字新基建”决策的不断部署,用电基数的不断增长,大量的电气设备被投入使用后增加了工况的复杂性,系统信息的体量规模日益庞大。这些数据信息种类多样,来源广泛,信息储存类型、信息收集和传输途径也呈现多样性特征,对电力数据存储和接入需求也越来越高,然而当前电力信息系统的数据接入速度和效率是无法满足需求的。
B+树是为磁盘及其他存储辅助设备而设计的一种平衡查找树。在B+树中所有的记录节点按大小顺序存放在同一层的叶子节点中,各个叶节点用指针连接。B+树算法能实现单次请求涉及的磁盘I/O次数少,查询效率稳定、遍历效率高效的数据索引需求。但电力系统中的数据具有明显的大数据特征和关联关系特性,传统的检索方法在实现高效的接入电网运行时各业务产生的海量高频数据过程中已经显得捉襟见肘。在电力数据接入速度调优方面,传统的做法往往是单一的数据库索引优化或者调整单一因子。针对海量高频数据实时接入的场景,业内较为领先的是采用设置时序数据在分布式消息队列的存储结构实现高速写入,然而并不能表示数据之间的关联关系,难以挖掘其中的数据价值信息。
倒排索引不能完成数值型数据的跨数据范围的检索需求且倒排文件对赋有权值的索引词无法处理。由于不同的索引词所需要的地址数目不固定,无法为倒排文件中的各项数据预留长度适宜的存储空间。倒排索引中由于任何一个索引词所罗列的地址是有序排列的,所以插入删除数据时平均需要移动一半的地址,更为严重的是在插入新地址使地址的个数超过原来预留的长度时,要么建立溢出区,要么对倒排文件进行重组,这两种处理都需要大量的时间导致倒排文件的更新速度缓慢,建立溢出区还严重影响检索速度。B+树索引不能对无序性的字符型数据进行处理。
发明内容
本发明实施例提供一种索引结构建立方法、装置、设备及存储介质,以实现能够针对电力数据的特点,构建双层索引结构,既能够解决跨数据范围检索的问题,又能对无序数据进行检索。
第一方面,本发明实施例提供了索引结构建立方法,包括:
获取电力数据的数据属性和属性值;
根据所述数据属性、所述属性值以及所述数据属性和所述属性值之间的关联关系,建立用于关联检索的上层B+树索引结构和下层索引结构,其中,所述上层B+树索引结构中的每个叶子节点中存储有关键字和叶子节点与下层索引节点和/或子图的链接信息。
第二方面,本发明实施例还提供了一种索引结构建立装置,该装置包括:
获取模块,用于获取电力数据的数据属性和属性值;
建立模块,用于根据所述数据属性、所述属性值以及所述数据属性和所述属性值之间的关联关系,建立用于关联检索的上层B+树索引结构和下层索引结构;其中,所述上层B+树索引结构中的每个叶子节点中存储有关键字和叶子节点与下层索引节点和/或子图的链接信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网有限公司大数据中心,未经国家电网有限公司大数据中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110597931.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种牡丹籽油的脱色方法
- 下一篇:一种装配式便携安全栏杆组件及其装配方法