[发明专利]一种存储系统的故障处理方法及装置在审
申请号: | 201710096476.3 | 申请日: | 2017-02-22 |
公开(公告)号: | CN106874136A | 公开(公告)日: | 2017-06-20 |
发明(设计)人: | 方浩 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王宝筠 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储系统 故障 处理 方法 装置 | ||
1.一种存储系统的故障处理方法,其特征在于,包括:
采集存储系统的不同故障信息,其中,所述存储系统采用基于Sanlock的管理机制;
根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型;
利用Sanlock的租约,分别对各等级的故障类型进行隔离,并针对不同等级的故障类型提供相对应的处理措施,其中,所述租约包括:delta lease和paxos lease。
2.根据权利要求1所述的故障处理方法,其特征在于,所述根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成不同等级的故障类型包括:
根据Sanlock提供的不同的锁失效管理策略,将所述不同故障信息划分成六种等级的故障类型,按照等级从低到高的顺序,依次包括:
第一等级,所述第一等级对应的故障类型包括:存储瞬时的链路颠簸;
第二等级,所述第二等级对应的故障类型包括:进程短期更新时间戳失败;
第三等级,所述第三等级对应的故障类型包括:进程长期更新时间戳失败;
第四等级,所述第四等级对应的故障类型包括:存储短期离线;
第五等级,所述第五等级对应的故障类型包括:存储长期离线;
第六等级,所述第六等级对应的故障类型包括:数据无法完全清理。
3.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统发生所述第一等级对应的故障类型时,处理措施包括:
切换路径避免业务中断;
或当存储上层的虚拟机业务不均衡时,配置负载均衡。
4.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统发生所述第二等级对应的故障类型或所述第三等级对应的故障类型时,利用Sanlock的租约的处理措施包括:
控制虚拟机通过Sanlock代理模块申请一个paxoslease;
将锁的相关信息记录在共享存储中与所述虚拟机对应的锁空间上;
启动delta lease来定时更新时间戳;
判断新申请的paxos lease未更新时间戳的时间是否大于第一预设时间;
若所述新申请的paxos lease未更新时间戳的时间不大于所述第一预设时间,则定义所述虚拟机的当前状态为有效状态;
若所述新申请的paxos lease未更新时间戳的时间大于所述第一预设时间,同时小于第二预设时间,则监控模块定义当前故障类型为第二等级,并调用Sanlock的控制清理功能恢复所述新申请的paxos lease;
其中,所述第二预设时间大于所述第一预设时间。
5.根据权利要求4所述的故障处理方法,其特征在于,还包括:
若所述新申请的paxos lease未更新时间戳的时间不小于所述第二预设时间,则定义当前故障类型为第三等级,并调用清理模块中的强制清理功能,强制关闭所述虚拟机。
6.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统发生所述第四等级对应的故障类型时,利用Sanlock的租约的处理措施包括:
当delta lease对应的所有paxos lease都无法正常更新时间戳时,若监控模块监测所述所有paxos lease未更新时间戳的时间均大于第三预设时间时,则定义当前故障类型为第四等级;
调用清理模块中的全部暂停脚本;
通过所述全部暂停脚本,查询所述所有paxos lease相对应的虚拟机,并对查询到的所有虚拟机执行暂停的操作,停止各虚拟机继续下发业务。
7.根据权利要求2所述的故障处理方法,其特征在于,当所述存储系统发生所述第五等级对应的故障类型时,利用Sanlock的租约的处理措施包括:
当监控模块监测所有paxos lease未更新时间戳的时间均大于第四预设时间时,则定义当前故障类型为第五等级;
调用清理模块中的全部清理脚本;
通过所述全部清理脚本查询所述paxos lease相对应的虚拟机,并对所有查询到的虚拟机发送终止信号,强制关闭所有虚拟机,同时释放delta lease。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710096476.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于检测机房故障的方法、装置及设备
- 下一篇:一种JS引擎容错方法和装置