[发明专利]一种存储系统的故障处理方法及装置在审
申请号: | 201710096476.3 | 申请日: | 2017-02-22 |
公开(公告)号: | CN106874136A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 方浩 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储系统 故障 处理 方法 装置 | ||
技术领域
本发明涉及计算机应用技术领域,更具体的说,涉及一种存储系统的故障处理方法及装置。
背景技术
共享存储作为目前企业虚拟化软件中的主流存储方式,它的主要职责是为虚拟机和上层业务提供数据支撑。目前的共享存储通常由存储系统进行管理,因此,存储系统的稳定性直接关系到整个虚拟化系统的稳定性。若存储系统发生故障,如服务器故障或各种设备故障,则会造成系统服务中断,从而造成客户的流失和企业收入的损失。
然而,针对存储系统出现的故障,目前市场上的开源软件及商业软件尚无完善的解决方案。
发明内容
有鉴于此,本发明公开了一种存储系统的故障处理方法及装置,以解决目前针对存储系统出现的故障,市场上的开源软件及商业软件尚无完善的解决方案的问题。
一种存储系统的故障处理方法,包括:
采集存储系统的不同故障信息,其中,所述存储系统采用基于Sanlock的管理机制;
根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型;
利用Sanlock的租约,分别对各等级的故障类型进行隔离,并针对不同等级的故障类型提供相对应的处理措施,其中,所述租约包括:delta lease和paxos lease。
优选的,所述根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型包括:
根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成六种等级的故障类型,按照等级从低到高的顺序,依次包括:
第一等级,所述第一等级对应的故障类型包括:存储瞬时的链路颠簸;
第二等级,所述第二等级对应的故障类型包括:进程短期更新时间戳失败;
第三等级,所述第三等级对应的故障类型包括:进程长期更新时间戳失败;
第四等级,所述第四等级对应的故障类型包括:存储短期离线;
第五等级,所述第五等级对应的故障类型包括:存储长期离线;
第六等级,所述第六等级对应的故障类型包括:数据无法完全清理。
优选的,当所述存储系统发生所述第一等级对应的故障类型时,处理措施包括:
切换路径避免业务中断;
或当存储上层的虚拟机业务不均衡时,配置负载均衡。
优选的,当所述存储系统发生所述第二等级对应的故障类型或所述第三等级对应的故障类型时,利用Sanlock的租约的处理措施包括:
控制虚拟机通过Sanlock代理模块申请一个paxos lease;
将锁的相关信息记录在共享存储中与所述虚拟机对应的锁空间上;
启动delta lease来定时更新时间戳;
判断新申请的paxos lease未更新时间戳的时间是否大于第一预设时间;
若所述新申请的paxos lease未更新时间戳的时间不大于所述第一预设时间,则定义所述虚拟机的当前状态为有效状态;
若所述新申请的paxos lease未更新时间戳的时间大于所述第一预设时间,同时小于第二预设时间,则监控模块定义当前故障类型为第二等级,并调用Sanlock的控制清理功能恢复所述新申请的paxos lease;
其中,所述第二预设时间大于所述第一预设时间。
优选的,还包括:
若所述新申请的paxos lease未更新时间戳的时间不小于所述第二预设时间,则定义当前故障类型为第三等级,并调用清理模块中的强制清理功能,强制关闭所述虚拟机。
优选的,当所述存储系统发生所述第四等级对应的故障类型时,利用Sanlock的租约的处理措施包括:
当delta lease对应的所有paxos lease都无法正常更新时间戳时,若监控模块监测所述所有paxos lease未更新时间戳的时间均大于第三预设时间时,则定义当前故障类型为第四等级;
调用清理模块中的全部暂停脚本;
通过所述全部暂停脚本,查询所述所有paxos lease相对应的虚拟机,并对查询到的所有虚拟机执行暂停的操作,停止各虚拟机继续下发业务。
优选的,当所述存储系统发生所述第五等级对应的故障类型时,利用Sanlock的租约的处理措施包括:
当监控模块监测所有paxos lease未更新时间戳的时间均大于第四预设时间时,则定义当前故障类型为第五等级;
调用清理模块中的全部清理脚本;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710096476.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测机房故障的方法、装置及设备
- 下一篇:一种JS引擎容错方法和装置