[发明专利]一种GlusterFS故障自动处理方法及装置在审
申请号: | 202110144639.7 | 申请日: | 2021-02-02 |
公开(公告)号: | CN112799866A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 刘贵宗 | 申请(专利权)人: | 北京明略昭辉科技有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/14;G06F16/182 |
代理公司: | 成都众恒智合专利代理事务所(普通合伙) 51239 | 代理人: | 刘华平 |
地址: | 100089 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 glusterfs 故障 自动 处理 方法 装置 | ||
本发明涉及一种GlusterFS故障自动处理方法及装置,包括心跳单元周期性地收集、维护及标记GlusterFS集群中每一台服务器节点上各存储单元的状态和故障存储单元的故障持续时间;故障评估及处理单元管理所述GlusterFS集群中的存储资源,并与所述心跳单元交互以周期性地评估所述存储单元是否故障及自动处理故障存储单元。基于本发明所提出的故障自动处理方法相关机制及故障自动处理装置,当有brick发生故障时,可以及时发现该故障并自动处理故障,相较于当前的技术方案,可以显著提升数据的安全性和GlusterFS文件系统的稳定性。
技术领域
本发明属于存储领域,具体涉及一种GlusterFS故障自动处理方法及装置。
背景技术
GlusterFS是一个去中心化的、可靠的、可扩展的、分布式的文件系统,能够将多台服务器的磁盘存储资源聚合在一起提供存储服务,其系统架构如图1所示:每一个服务器节点上都包含一定数量的磁盘,每一块磁盘上会根据用户需要划分出指定大小的多个分区作为brick的存储路径,brick即为GlusterFS服务端使用的存储单元;GlusterFS以volume的形式对外提供存储服务,volume有多种类型,每一个volume都由指定数量的brick组成;每一个brick都有一个与之对应的管理进程glusterfsd,该进程负责管理brick与同一volume中的其它brick之间以及与client之间的通信和数据传输;每一个服务器节点上都运行一个glusterd进程,该进程负责管理整个集群中所有的volume以及该节点上所有的glusterfsd进程,各节点上的glusterd进程组成一个TSP(Trusted Storage Pool),TSP即代表对外提供存储服务的整个GlusterFS集群;client挂载指定的volume后即可向该volume写入数据或从该volume读出数据,实质上是与组成该volume的brick之间进行通信和数据传输。
volume v1可表示一个典型的复制卷,由三个birck组成,分别为:node_1disk_1brick_1、node_2disk_1brick_2、node_3disk_2brick_1,为表述方便,以下将这三个brick分别简称为:brick_a、brick_b、brick_c,并假设其大小为1GB。这三个brick上存储完全相同的数据,互为备份。
在实际的生产环境中,因磁盘故障、机器故障、系统负载、网络负载等原因,可能会导致TSP中的brick发生故障(如掉线),作为GlusterFS基本的存储单元,brick故障会直接影响数据的访问。如何及时感知brick故障并且有效地处理故障对于数据的安全性和GlusterFS文件系统的稳定性具有重要意义。
在现有技术方案中,当有brick发生故障时,必须等待系统管理员主动查看volume的状态才能够发现该故障brick;在处理故障brick时,需要系统管理员在集群中一块空间足够的磁盘上划分出一个指定大小的分区并将其设置为新brick的存储路径,然后通过gluster命令用此新brick替换故障brick并释放故障brick的存储资源,最终完成对故障brick的处理。
由于在现有技术方案中,故障brick的感知及处理需要系统管理员手动操作。因此,当有brick发生故障时,该故障并不能够被及时感知并处理,这会给数据的安全性和GlusterFS文件系统的稳定性带来很大的风险。
发明内容
基于现有技术方案中故障brick的感知及处理机制存在的不足,本发明旨在提出一种无需人工介入的、自动化的故障自动处理方法及装置。当有brick发生故障时,可以及时发现该故障并自动处理故障,相较于当前的技术方案,可以显著提升数据的安全性和GlusterFS文件系统的稳定性。
本发明解决上述技术问题的技术方案如下:
第一方面,本发明提供一种GlusterFS故障自动处理方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略昭辉科技有限公司,未经北京明略昭辉科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110144639.7/2.html,转载请声明来源钻瓜专利网。