[发明专利]一种处理设备故障的方法和系统有效
申请号: | 201810226159.3 | 申请日: | 2018-03-19 |
公开(公告)号: | CN108509296B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 范家星;过晓春 | 申请(专利权)人: | 网宿科技股份有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F3/06 |
代理公司: | 北京华智则铭知识产权代理有限公司 11573 | 代理人: | 陈向敏 |
地址: | 200030 上海市徐汇区*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 处理 设备 故障 方法 系统 | ||
本发明公开了一种处理设备故障的方法和系统,属于数据存储技术领域。所述方法包括:目标共享存储设备关联的目标备用设备检测管理所述目标共享存储设备的目标控制设备的运行状态;如果所述目标控制设备发生故障,所述目标备用设备向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;所述目标共享存储设备将所述目标备用设备设置为本地管理设备;所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备。采用本发明,可以保证分布式存储系统的存储服务质量。
技术领域
本发明涉及数据存储技术领域,尤其涉及一种处理设备故障的方法和系统。
背景技术
当前网络业务的种类越来越多,功能也越来越丰富,也随之产生了海量的数据。业务提供方一般采用分布式存储系统来存储数据,其中的数据可以分散存储在存储集群的多个存储服务器(可称为存储节点)中。
分布式存储系统在提供存储服务时,可以对每份数据创建多份数据副本,并将这些数据副本存储在多个存储节点中。如果某个存储节点发生故障,不能继续提供数据存储服务,分布式存储系统的集群管理节点可以先确定故障节点存储的数据,再查找存储有相应数据副本的多个存储节点,同时可以选择多个目标存储节点,然后可以指示上述存储有数据副本的存储节点,利用数据副本将数据恢复到上述多个目标存储节点中。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
上述用于数据恢复的多个存储节点,需要调配大量的设备处理资源来进行上述数据恢复处理,导致没有足够的设备处理资源来提供数据存储服务,故而分布式存储系统的存储服务质量较差。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种处理设备故障的方法和系统。所述技术方案如下:
一方面,提供了一种处理设备故障的方法,所述方法应用于分布式存储系统,所述分布式存储系统包括集群管理节点和多个存储节点,每个存储节点包括一个共享存储设备,每个共享存储设备与一个控制设备、一个备用设备关联,所述方法包括:
目标共享存储设备关联的目标备用设备检测管理所述目标共享存储设备的目标控制设备的运行状态;
如果所述目标控制设备发生故障,所述目标备用设备向所述目标共享存储设备发送管理请求,并向所述集群管理节点发送对于所述目标控制设备的替换请求;
所述目标共享存储设备将所述目标备用设备设置为本地管理设备;
所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备。
进一步的,所述管理请求中携带有所述目标备用设备的元数据信息;
所述目标共享存储设备将所述目标备用设备设置为本地管理设备,包括:
所述目标共享存储设备通过将所述目标共享存储设备的归属者信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述共享存储设备的本地管理设备。
进一步的,所述替换请求中携带有所述目标控制设备所属存储节点的节点标识和所述目标备用设备的元数据信息;
所述集群管理节点确定所述目标备用设备为所述目标控制设备的替换设备,包括:
所述集群管理节点通过将所述目标控制设备所属存储节点的节点标识对应的元数据信息修改为所述目标备用设备的元数据信息,确定所述目标备用设备为所述目标控制设备的替换设备。
进一步的,每个共享存储设备还与至少一个空闲设备关联;
所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于网宿科技股份有限公司,未经网宿科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810226159.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:存储器系统的操作方法
- 下一篇:一种数据备份方法和系统