[发明专利]大规模分布式存储系统中数据恢复方法及装置有效
申请号: | 201811636550.7 | 申请日: | 2018-12-29 |
公开(公告)号: | CN111382134B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 张广艳;王竹凡 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/182 | 分类号: | G06F16/182;G06F11/14 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大规模 分布式 存储系统 数据 恢复 方法 装置 | ||
本发明实施例提供一种大规模分布式存储系统中数据恢复方法及装置,该方法包括:使用元数据服务器扫描获取恢复任务,使用调度器读入并等待调度各所述恢复任务;将恢复任务的恢复时间划分成多个时间片,在各时间片根据所述存储系统的带宽使用信息,确定下放适量恢复任务;获取优选工作节点,若各恢复任务对应的数据块副本在优选工作节点中存在,则将优选工作节点中的一个作为该恢复任务的执行源节点;从所述正常工作节点中选择各恢复任务的执行目的节点,将恢复任务下放到执行源节点和执行目的节点,从而实现恢复任务的调度和执行。本发明实施例提高了数据恢复的速率,且对前台干扰小。
技术领域
本发明实施例属于分布式存储系统技术领域,更具体地,涉及一种大规模分布式存储系统中数据恢复方法及装置。
背景技术
如今大型存储系统可以拥有大量机器,每台机器有很大的存储空间。为了进行快速故障恢复,通常将数据分成块,这些数据块以多副本的形式保存在不同的节点里。当出现故障时,其他节点可以并行地重新复制其数据块以维护各数据块的冗余度。在大型存储系统中,经常需要进行数据恢复。
当前分布式存储系统广泛使用主从架构。分布式存储系统中每个ChunkServer用于存储数据块并在需要时将数据块传送到其他ChunkServers。MetaServer维护分布式文件系统的元数据,包括特定数据的位置和其他有用信息。有些规模非常大的系统具有的多个MetaServers。这些MetaServers以分布式方式组织,每组MetaServer只维护整个存储系统的元数据子集,每个小组都包含一些共识协议以容忍节点故障。此外,还有一个RootServer,用于提供路由服务,引导客户端到相应的MetaServer检索元数据。为了实现统一的数据分发,存储系统一般使用随机或加权随机机制将数据放在不同的ChunkServers上。为了在ChunkServer节点故障时保持相同级别的容错,恢复协议需要为故障节点上的每个数据块选择一对节点作为源节点和目标节点,并以一定的速率重新复制数据块。
现有的恢复协议为故障节点上的每个数据块随机选择源节点和目标节点,每个工作节点提供有限且固定的带宽用于恢复。当选择的节点带宽使用量较大时,会延迟恢复时间,如果在恢复期间发生其他故障,恢复时间越长,数据丢失的可能性就越大;此外,由于存储系统仍需要在恢复期间为应用程序的I/O请求提供服务,当下发的恢复任务过多时会对前台流量产生较大影响。
发明内容
为克服上述现有的数据恢复方法恢复可能延迟且对前台流量造成干扰的问题或者至少部分地解决上述问题,本发明实施例提供一种大规模分布式存储系统中数据恢复方法及装置。
根据本发明实施例的第一方面,提供一种大规模分布式存储系统中数据恢复方法,包括:
使用元数据服务器对存储系统的元数据进行扫描,若根据扫描结果获知故障工作节点中存在副本的数据块,将各所述数据块的恢复任务存储到所述存储系统中,使用调度器从所述存储系统中读入并等待调度各所述恢复任务;
将所述恢复任务的恢复时间划分成多个时间片,在各所述时间片内开始时根据所述存储系统的带宽使用信息,确定下放的所述恢复任务的数量;
将所述存储系统中剩余带宽大于第一预设阈值且存放受损数据块的副本数量小于第二预设阈值的正常工作节点作为优选工作节点,若各所述恢复任务对应的数据块副本在所述优选工作节点中存在,则将所述优选工作节点中的一个作为该恢复任务的执行源节点;
从所述正常工作节点中选择各所述恢复任务的执行目的节点,根据所述恢复任务的下放数量、执行源节点和执行目的节点下放所述恢复任务到各所述正常工作节点,使用各所述正常工作节点执行各所述恢复任务。
根据本发明实施例第二方面提供一种大规模分布式存储系统中数据恢复装置,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811636550.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种测距定位的方法及装置
- 下一篇:用于生产和分发粘合标签的系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置