[发明专利]存储节点故障处理方法、装置、设备及存储介质在审
申请号: | 202111660461.8 | 申请日: | 2021-12-30 |
公开(公告)号: | CN114281591A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 贺坤 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F11/14 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 常亮 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储 节点 故障 处理 方法 装置 设备 介质 | ||
本申请公开了一种存储节点故障处理方法、装置、电子设备及计算机可读存储介质,主节点在正常处理待写入数据时,将对应的条带元数据发送至从节点处备份,当主节点发生故障时,可以由目标从节点接替主节点的工作,由于目标从节点具有主节点的条带元数据的备份,因此其接替工作后能够保证集群的数据一致性。当主节点故障恢复后,目标从节点可以将其在主节点故障恢复期间新生成的新增条带元数据发发送至主节点,使得主节点能够根据新增条带元数据继续执行写入工作,业务从目标从节点到主节点的转移同样可以保证集群的数据一致性,解决了节点故障导致的数据不一致的问题。
技术领域
本申请涉及存储技术领域,特别涉及一种存储节点故障处理方法、存储节点故障处理装置、电子设备及计算机可读存储介质。
背景技术
在存储技术领域,RAID(Redundant Array of Independent Disks)即独立磁盘冗余阵列,通常简称为磁盘阵列。RAID是由多个独立的高性能磁盘驱动器组成的磁盘子系统,从而提供比单个磁盘更高的存储性能和数据冗余的技术。RAID的两个关键目标是提高数据可靠性和I/O性能。磁盘阵列中,数据分散在多个磁盘中,然而对于计算机系统来说,就像一个单独的磁盘。通过把相同数据同时写入到多块磁盘(典型地如镜像),或者将计算的校验数据写入阵列中来获得冗余能力,当单块磁盘出现故障时可以保证不会导致数据丢失。
在实际应用中,存储系统多是集群的方式运行,双控或者更多的节点组成的集群,集群中由于硬件故障,电源故障,软件故障等不可避免的会发生节点故障,在节点故障过程中也会发生节点重启、节点失效、节点更换等操作,在节点发生故障后,如何保障数据的一致性和正确性至关重要。
发明内容
有鉴于此,本申请的目的在于提供一种存储节点故障处理方法、存储节点故障处理装置、电子设备及计算机可读存储介质,保证集群的数据一致性。
为解决上述技术问题,本申请提供了一种存储节点故障处理方法,应用于存储集群中的主节点,所述存储集群中还包括从节点,所述方法包括:
获取第一待写入数据,并将所述第一待写入数据存入磁盘阵列;
生成所述第一待写入数据对应的校验元数据和条带元数据,并将所述条带元数据发送至所述从节点;
更新元数据位图信息;其中,所述元数据位图信息存储于所述主节点和所述从节点能够访问的存储位置;
将所述校验元数据和条带元数据存入所述磁盘阵列;
若检测到节点故障,则执行故障恢复启动处理,并触发故障通知,以便所述从节点中的目标从节点响应于所述故障通知,利用所述条带元数据和所述元数据位图信息执行元数据写入业务;
在故障恢复启动成功后,获取所述目标从节点发送的新增条带元数据,并利用所述新增条带元数据和所述元数据位图信息执行元数据写入业务。
可选地,所述利用所述新增条带元数据和所述元数据位图信息执行元数据写入业务,包括:
从所述磁盘阵列中读取所述新增条带元数据对应的目标第一待写入数据,并生成所述目标第一待写入数据对应的目标校验元数据;
基于所述元数据位图信息,将所述目标校验元数据和所述新增条带元数据写入所述磁盘阵列。
可选地,所述在故障恢复启动成功后,获取所述目标从节点发送的新增条带元数据,包括:
在故障恢复启动成功后,判断所述目标从节点是否处于故障状态;
若处于所述故障状态,则等待所述目标从节点故障恢复启动成功后,接收所述目标从节点发送的新增条带元数据;
若不处于所述故障状态,则接收所述目标从节点发送的新增条带元数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111660461.8/2.html,转载请声明来源钻瓜专利网。