[发明专利]一种数据优化的方法及装置有效

专利信息
申请号: 201811209843.7 申请日: 2018-10-17
公开(公告)号: CN109284295B 公开(公告)日: 2021-09-17
发明(设计)人: 岳斌 申请(专利权)人: 郑州云海信息技术有限公司
主分类号: G06F16/22 分类号: G06F16/22;G06F16/2453
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 王宝筠
地址: 450018 河南省郑州市*** 国省代码: 河南;41
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 数据 优化 方法 装置
【说明书】:

本申请实施例公开了一种数据优化的方法,采用插入合并与负载均衡的算法,对达到阈值的子节点进行合并或负载均衡,当树的深度较大时,可以明显减少树的深度和子节点的数量,节省存储资源开支,提高存储效率。本申请实施例方法包括:计算第一节点的空置率以及第二节点的空置率,该第一节点与该第二节点相邻,该空置率为各节点中空白因子数量占总节点因子数量的比例;若该第一节点和该第二节点中至少一个节点的空置率达到第一阈值,则生成第三节点,该第三节点包含该第一节点与该第二节点的所有非空白因子。

技术领域

本申请涉及计算机领域,具体涉及一种数据优化的方法及装置。

背景技术

在存储领域,海量数据查询和存储需要占用超大的资源,严重影响了数据存储的性能。为了降低存储数据占用的资源,提高数据存储性能,目前已经产生了各种成熟并且效果非常好的查询算法。

其中,最经典的属于B+Tree算法。现有的研究机构主要致力于研究如何采用提高硬件性能和优化算法两方面进行性能提升,单纯提高硬件性能并不能发挥最大效益,需结合恰当的优化算法实现性能提升。当做数据插入时,B+Tree会优先拆分叶子节点(LeafPage),随着数据的增加,还会通过增加Tree的深度来扩大存储。

在数据量比较小的时候B+Tree算法还能满足性能要求。但是当应用于海量存储时,过多的Leaf Page和过深的Tree深度,会影响数据查询的效率,且需要占用过多的资源,影响数据存储的性能。

发明内容

本申请实施例提供了一种数据优化的方法,通过采用插入合并的算法,对空置率达到阈值的Leaf Page进行合并,当树的深度较大时,可以明显减少树的深度和Leaf Page的数量,节省存储资源开支,提高存储效率。进一步的对相邻Leaf Page负载均衡可以平衡各Leaf Page内的节点,平均空置率,在后续因子添加时,减少拆分页操作,进一步提高了存储的性能。

为达到上述目的,本申请实施例提供如下技术方案:

本申请第一方面提供一种数据优化的方法,该方法可采用C语言算法描述,然后通过Java的C调用方法嵌入存储系统,该数据优化的方法在执行过程中涉及到的数据优化装置在智能终端中对应相应的功能实体。该方法可以包括:计算第一节点的空置率以及第二节点的空置率,该第一节点与该第二节点相邻,该空置率为各节点中空白因子数量占总节点因子数量的比例;

若该第一节点和该第二节点中至少一个节点的空置率达到第一阈值,则生成第三节点,该第三节点包含该第一节点与该第二节点的所有非空白因子。

可选的,在本申请的一些实施例中,若该第一节点或该第二节点中至少一个节点的空置率达到第一阈值,则生成第三节点之后,该方法还包括:第一根节点因子更新为第二根节点因子,该第二根节点因子为该第三节点的最后一个非空白因子,该第一根节点因子为该第一节点和该第二节点的索引因子。

可选的,在本申请的一些实施例中,该第一根节点因子更新为第二根节点因子,包括:删除该第一根节点因子;添加该第三节点的最后一个非空白因子为该第二根节点因子。

可选的,在本申请的一些实施例中,若该第一节点和该第二节点中至少一个节点的空置率达到第一阈值,则生成第三节点之后,该方法还包括:计算该第三节点的不平衡率,该第三节点的不平衡率为该第三节点的空置率占该第三节点的空置率与第四节点的空置率之和的比率,该第三节点与该第四节点相邻,该第四节点的不平衡率未达到第二阈值;若该第三节点的不平衡率达到该第二阈值,则对该第三节点进行负载均衡。

可选的,在本申请的一些实施例中,若该第三节点的不平衡率达到该第二阈值,则对该第三节点进行负载均衡之后,该方法还包括:第三根节点因子更新为第四根节点因子,该第四根节点因子为该第三节点的最后一个非空白因子,该第三根节点因子为该第一节点和该第二节点的索引因子。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811209843.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top