[发明专利]一种基于网络拓扑的平衡二叉树修复方法在审
申请号: | 201811017396.5 | 申请日: | 2018-09-01 |
公开(公告)号: | CN109194444A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 关智允;张玲玲;任龙;王磊;王鑫;徐东;孟宇龙;张子迎;李贤;宫思远 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | H04L1/00 | 分类号: | H04L1/00;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 平衡二叉树 修复 数据修复 网络拓扑 数据存储领域 网络带宽 星型结构 修复效率 构建 占用 | ||
本发明属于数据存储领域,具体涉及一种基于网络拓扑的平衡二叉树修复方法。包括以下步骤:构建修复平衡二叉树;数据修复。本发明所述的是一种基于平衡二叉树的纠删码技术,克服传统采用星型结构的纠删码在数据修复时,占用较高网络带宽的问题,提高修复效率,降低修复时间。
技术领域
本发明属于数据存储领域,具体涉及一种基于网络拓扑的平衡二叉树修复方法。
背景技术
进入大数据时代,数据的规模呈迅速发展的趋势,体量变得越来越庞大。规模庞大并且仍然在不断迅速增长的数据,对构建良好的存储系统提出了重大挑战。数据容错是大规模分布式存储系统中一项不可或缺的关键技术,由于数据量极为庞大,该类存储系统往往包含几千甚至几万个存储节点。因此,采用一定的数据容错技术,从而保证在部分存储节点失效的情况下数据仍然能够被正常地访问就显得尤为重要。
分布式存储系统中常用的数据容错技术有两种:一种是多副本容错技术,通过复制进行容错;另一种是纠删码容错技术,通过编码进行容错。与多副本容错技术相比,纠删码容错技术可以有效降低存储空间消耗并提供较好的数据容错能力。
目前,网络带宽资源是制约利用纠删码进行数据修复的主要瓶颈。分布式存储系统中降低网络带宽资源占用的方法有以下两种:一、优化纠删码的结构;二,优化数据修复的过程,通过优化数据修复时的数据读取和数据传输效率,提高数据修复的效率。传统的数据修复方法通常采用星型拓扑结构作为数据传输方式,所有帮助节点直接将数据发送给新生节点,所有参与修复的节点构成一个以新生节点为中心的星型结构。基于星型结构的数据修复方法具有简单直观的优点,但存在占用较高网络带宽的问题。
综上所述,现有技术中存在受限于新生节点的网络带宽未考虑到、网络拓扑对修复占用网络资源的影响等问题。
发明内容
本发明的目的是针对传统星型结构的数据修复方式存在的网络带宽占据较高的问题,提出一种基于平衡二叉树的纠删码技术,利用平衡二叉树左右子树高度差小于等于1的性质,将参与修复的节点组织成网络距离较小的树形结构,缩短修复期间数据的传输距离,降低修复时的网络带宽和修复时间,提升修复效率。
一种基于网络拓扑的平衡二叉树修复方法,包括以下步骤:
(1.1)构建修复平衡二叉树;
(1.2)数据修复。
所述构建修复平衡二叉树,包括以下步骤:
(2.1)根据所采用的纠删码确定用来修复失效块c0的编码块c1,c2,Λ,cr,并计算出相应的修复系数向量(β1β2…βr);
(2.2)从系统中获得用以修复的编码块分别所在节点,记为V1,V2,Λ,Vr,并根据系统放置策略确定出新生节点,记为V0,并记录下相互之间的网络距离;
(2.3)根据节点之间的网络距离构建出修复所有的平衡二叉树。
所述数据修复,包括:
如果用以修复的编码块所在节点为树中的叶子节点,则负责从本地存储系统中读取编码块ci,并计算出βici,然后将其发送给自己的父节点;
如果用以修复的编码块所在节点为内部节点,则负责接受其子节点发送过来的数据,并从本地存储系统中读取编码块,将结果加在一起之后再次发送给自己的父节点;
如果用以修复的编码块所在节点为根节点,则负责接受其子节点发送过来的数据,计算出总和,然后将结果写入本地存储。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811017396.5/2.html,转载请声明来源钻瓜专利网。