[发明专利]一种Hadoop分布式文件系统HDFS纠删码冗余备份方法有效

专利信息
申请号: 201510976944.7 申请日: 2015-12-23
公开(公告)号: CN105635252B 公开(公告)日: 2019-06-25
发明(设计)人: 王垒 申请(专利权)人: 浪潮集团有限公司
主分类号: H04L29/08 分类号: H04L29/08;H04L12/24
代理公司: 济南信达专利事务所有限公司 37100 代理人: 姜明
地址: 250101 山东*** 国省代码: 山东;37
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 hadoop 分布式 文件系统 hdfs 纠删码 冗余 备份 策略
【权利要求书】:

1.一种Hadoop分布式文件系统HDFS纠删码冗余备份方法,其特征在于:包括编码过程,数据完整性检查和不完整数据恢复三部分;所述编码过程是由冗余编码节点周期性发起的,通过纠删码算法将HDFS文件进行冗余备份,并将HDFS原有三副本删除,冗余编码节点从HDFS上获取需raid的文件及文件blocks列表,冗余编码节点从HDFS读取数据执行编码,并将冗余块parities上传到HDFS;所述数据完整性检查是冗余编码节点周期性检查的,将损坏且能恢复的数据块添加到恢复数据列表中;所述不完整数据恢复即解码过程,由冗余编码节点周期性发起,通过纠删码解码算法对不完整数据进行恢复,从HDFS获取损坏冗余块parities,执行解码,并将恢复的数据上传到HDFS;如果不能恢复删除文件,则报告HDFS元数据节点。

2.根据权利要求1所述的Hadoop分布式文件系统HDFS纠删码冗余备份方法,其特征在于:调用HDFS客户端接口实现对HDFS数据的操作,纠删码算法库采用Jerasure开源库;对应的纠删码冗余备份模块独立于HDFS,成为独立的可插拔模块。

3.根据权利要求1所述的Hadoop分布式文件系统HDFS纠删码冗余备份方法,其特征在于:所述编码过程,包括以下步骤:

(1)冗余编码节点检查raid.Check Conf.delay是否满足,满足则执行步骤(2),不满足则执行步骤(1);

(2)冗余编码节点处理参数,包括获取待编码文件,编码路径及编码方式;

(3)查询编码路径状态,判断是否包含目录且非local模式;

(4)如果不包含目录或者当前模式是local模式,则本地执行冗余编码,通过冗余编码节点遍历编码路经下所有文件并编码;

(5)如果包含目录且当前模式是dist模式,则向冗余编码节点提交冗余请求;冗余编码节点接收到client提交的请求后,根据提交的参数构造一个raid-policy,并添加到配置管理器中,等待冗余编码节点上守护线程处理该policy,执行编码。

4.根据权利要求1所述的Hadoop分布式文件系统HDFS纠删码冗余备份方法,其特征在于:所述数据完整性检查和不完整数据恢复,包括以下步骤:

(1)冗余编码节点检查raid.Check Integer.delay是否满足,满足则执行步骤(2),不满足则执行步骤(1);

(2)冗余编码节点判断损坏数据是否能恢复,不能恢复执行则执行步骤(3),能恢复执行则执行步骤(4);

(3)冗余编码节点报告HDFS数据块损坏;

(4)将数据块添加到修复队列,冗余编码节点周期性对恢复队列中的数据进行检查和修复。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮集团有限公司,未经浪潮集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201510976944.7/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top