[发明专利]一种基于Erasure编码和副本技术的数据备份方法有效
申请号: | 200910182016.8 | 申请日: | 2009-07-29 |
公开(公告)号: | CN101630282A | 公开(公告)日: | 2010-01-20 |
发明(设计)人: | 余勇;邓松;林为民;唐汗青 | 申请(专利权)人: | 国网电力科学研究院;南京南瑞集团公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F17/30 |
代理公司: | 南京知识律师事务所 | 代理人: | 汪旭东 |
地址: | 210003江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Erasure编码和副本技术的数据备份方法。当待存储的数据超过了存储资源的最大容量后,数据需要进行分割后分布式存储,以提高存储效率。同时对这些分割后的数据子块计算校验码,并存储这些校验码,在部分数据子块受损的情况下,利用Erasure编码来恢复出受损的数据子块,保证了原始数据的完整性。采用副本的方法来备份原始数据,同时根据存储服务器的个数等参数来确定数据副本产生的数量。最后所产生的数据副本元数据信息存储到副本数据库中,以便在发生数据灾难时,用户通过查询副本数据库利用数据副本来恢复原始数据。通过数据分割和副本创建技术来更好地解决数据容灾中的数据备份问题,既提高了数据的存储效率,又保证了数据的完整性。 | ||
搜索关键词: | 一种 基于 erasure 编码 副本 技术 数据 备份 方法 | ||
【主权项】:
1.一种基于Erasure编码和副本技术的数据备份方法,其特征在于,包括以下步骤:步骤1:用户根据数据分割控制器查询数据分割知识库来判断是否需要进行数据分割,若需要分割则进入到下一步,否则转到步骤7;步骤2:确定数据文件分割的块数n和生成校验码的个数m,按照分割块数n和校验码个数m分别构造待m×n阶的范得蒙矩阵Fm×n;步骤3:分割原始数据文件,并构造分割后的数据矩阵Dn×1,并计算Fm×n×Dn×1得到对应的校验码矩阵Cm×1,同时生成分割日志信息;步骤4:将生成的n块子数据文件和m个校验码分别存储到指定的存储器上,同时把分割后的数据子块的文件名、数据子块大小、生成的校验码、校验码大小以及存储在远程节点的URL存储到分割数据库中;步骤5:构造矩阵A ( n + m ) × n = I n × n F m × n ]]> 和E ( n + m ) × 1 = D n × 1 C m × 1 , ]]> 且满足A(n+m)×n×Dn×1=E(n+m)×1,其中In×n为n×n阶的单位矩阵;步骤6:当分割后的数据子块有p(p≤m)块受损不能使用时,则将p个数据子块对应的矩阵A(n+m)×n和E(n+m)×1中的行删除掉,得到新的矩阵A(n+m-p)×n和E(n+m-p)×1,然后通过计算A-1n×(n+m-p)×E(n+m-p)×1就可以恢复出原始数据Dn×1;步骤7:首先确定存储服务器的个数N;期望得到的数据副本可靠性概率Pexpect;可以接受的网络带宽消耗Bpermit;数据服务器备份其他服务器的数据个数M;两台存储服务器之间发送消息的大小k;海量数据副本维护过程中海量数据传递的网络开销C;步骤8:然后代入式(1)计算出副本个数的取值范围,然后根据此范围来确定副本产生的最佳个数;[ 1 - ( 1 - p ) m ] N * m ≥ P expect M × k × N × f × m + [ C - M × k × N ] × f ≤ B per min - - - ( 1 ) ]]> 步骤9:所产生的数据副本元数据信息包括原始数据名、大小、原始数据所在的位置URL、各数据副本名、大小以及副本数据所在的位置URL存储到副本数据库SDB中;步骤10:数据备份结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网电力科学研究院;南京南瑞集团公司,未经国网电力科学研究院;南京南瑞集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/200910182016.8/,转载请声明来源钻瓜专利网。
- 上一篇:比索洛尔的经皮给药装置
- 下一篇:固体洗涤剂组合物及其制备方法