[发明专利]分布式存储中纠删码非对齐数据更新方法有效

专利信息
申请号: 201910690407.4 申请日: 2019-07-29
公开(公告)号: CN110515541B 公开(公告)日: 2020-10-27
发明(设计)人: 董小社;李征;张兴军;王宇菲 申请(专利权)人: 西安交通大学
主分类号: G06F3/06 分类号: G06F3/06;G06F11/10
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 李红霖
地址: 710049 *** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 分布式 存储 中纠删码非 对齐 数据 更新 方法
【说明书】:

发明公开了一种分布式存储中纠删码非对齐数据更新方法,在保证数据容错一致性以及数据可恢复的前提下,可实现纠删码数据的基本更新,并可实现纠删码数据的非对齐增量更新,接收用户发出的数据D0的更新,将纠删码数据块数据直接更新在原有数据块上,将数据D0更新所产生的纠删码校验块数据的更新以校验块数据更新增量Δ0的形式直接追加到校验块数据之后的预留空间中,对于纠删码数据更新时数据块的非对齐部分,将非对齐部分的数据块D’直接追加在原始数据块之后,并将非对齐部分按特定编码系数编码追加到所更新的校验块之后,以实现纠删码的非对齐数据更新。本发明所解决的是分布式存储中纠删码大规模使用的瓶颈之一。

技术领域

本发明属于分布式存储领域,更具体的,涉及分布式纠删码存储系统的一种非对齐纠删码数据更新方法。

背景技术

副本策略和纠删码是分布式存储领域常见的两种数据冗余技术。相比于副本策略,纠删码具有更高的磁盘利用率。例如Reed-Solomon码是一种常见的纠删码。多副本策略即将数据存储多个副本(一般是三副本,比如HDFS),当某个副本丢失时,可以通过其他副本复制回来,然而三副本的空间利用率为1/3。

纠删码技术主要是通过纠删码算法将原始的数据进行编码得到冗余,并将数据和冗余一并存储起来,以达到容错的目的。其基本思想是将n块原始的数据元素通过纠删编码矩阵计算,得到m块冗余元素(校验块),其中由n个数据块与m个校验块组成的集合称为条带。对于这n+m块的元素,当其中任意的m块元素出错(包括原始数据和冗余数据)时,均可以通过对应的重构算法恢复出原来的n块数据。生成校验的过程被称为编码(encoding),恢复丢失数据块的过程被称为解码(decoding)。磁盘利用率为n/(n+m)。基于纠删码的方法与多副本方法相比具有冗余度低、磁盘利用率高等优点,成为分布式存储系统的一大主流。

然而现有的分布式纠删码存储相比三副本存储存在很多问题,其中纠删码的数据更新不够灵活是一大主要问题。其主要有以下原因:纠删码数据在编码产生校验块时需要将原始数据数据按照条带中固定的数据块大小进行切分,然后才能使用相应的编码矩阵对切分好的数据块进行编码产生校验块。在分布式存储系统中这些严格切分的数据块与校验块会被分别存储在多块磁盘乃至多台机器中,变得分散且不连续,数据更新往往会涉及系统中多台机器上的数据更新。另外,在进行纠删码数据更新时需要同时更新纠删码校验块,以保证数据的容错一致性。因此目前纠删码上的数据更新比较困难,需要严格规范化更新数据块的大小,极度不灵活,且目前尚无有效办法解决纠删码上的非对齐数据更新。

发明内容

针对现有分布式纠删码存储中存在数据更新不够灵活的缺陷,本发明的目的在于提出一种分布式存储中纠删码非对齐数据更新方法,本发明针对分布式纠删码存储系统的非对齐数据更新,其能够实现纠删码上的任意长度灵活数据更新,而不用受限于纠删码数据按特定块大小对齐与数据多节点分散不连续所带来的问题,同时保证了纠删码数据在容错上的一致性,从而解决分布式纠删码存储系统上数据更新难且不够灵活的问题,使分布式纠删码存储系统能够做到灵活任意的数据更新。

为实现上述目的,本发明采用如下技术方案:

分布式存储中纠删码非对齐数据更新方法,包括以下步骤:

S1,分布式存储集群中主节点按照纠删码条带分块的大小将与原始数据D0相对应部分Phead+ΔPhead到Ptail-ΔPtail的待更新数据进行等量切分,得到数据段1,并按照S2~S4进行更新,将ΔPhead与ΔPtail部分按照步骤S5进行更新,ΔPhead与ΔPtail部分记为数据段2;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安交通大学,未经西安交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910690407.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top