[发明专利]一种存储系统单节点故障快速恢复IO的方法及装置有效
申请号: | 202010987811.0 | 申请日: | 2020-09-18 |
公开(公告)号: | CN111949452B | 公开(公告)日: | 2022-09-20 |
发明(设计)人: | 贺坤 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F11/30 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 王新爱 |
地址: | 215124 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 存储系统 节点 故障 快速 恢复 io 方法 装置 | ||
1.一种存储系统单节点故障快速恢复IO的方法,其特征在于,包括:第一步,由业务代表查询和调用业务接口执行业务,存储业务子模块向业务代表调用接口实现响应业务,所述业务代表连接存储业务子模块和集群事件管理模块,业务代表向外统一暴露接口;第二步,业务代表管理集群事件序列化,控制事件的统一发布和响应处理;
所述第一步具体包括以下步骤:
S100、将需要处理的事件传输到业务代表的缓存中,所述缓存为创建于集群主机端与业务代表端进行数据通信的缓存;
S101、设置业务代表属性类以及状态机;
S102、控制启动状态机业务代表算法;
S103、等待集群单节点加入离开事件的发生,从业务代表的缓存中,将接收的事件读取到业务代表状态机,完成事件发布状态更新以及通知主机I/O的下发;
所述第二步具体包括以下步骤:
S200、节点离开时,集群生成Pend,发送到业务代表端,I/O栈业务子模块存活节点保持I/O,并在业务端处理因节点离开所需的事务处理;
S201、集群BOSS节点切换、重构视图后生成Remove事件,发送到业务代表端,业务代表判断各业务个子模块业务处理是否完成;
S202、业务代表监听I/O所有业务子模块处理完成,统一下发Remove事件到各业务配置管理模块,触发I/O开始中断;
S203、IO中断后,所有子模块一起进行首选节点切换,元数据更新同步操作,完成后通知业务代表;
S204、业务代表收到所有子模块配置更新完成后通知主机,立即恢复I/O;
S205、节点加入时,集群生成Add/Unpend/UnpendDone事件;
S206 、业务代表收到集群事件放到缓存中,Add触发状态机通知各子模块业务层进行Nodes属性更新等操作,同时存活节点保持I/O;
S207、更新完成后,通知业务代表,等待节点加入后集群Unpend事件的触发,业务代表触发子业务模块进行Discard操作,存活节点不做操作,继续保持I/O;
S208、集群完成视图重建操作发送UnpendDone事件到业务代表;
S209、业务代表收到所有子模块配置更新完成后通知主机,立即恢复I/O。
2.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述步骤S100中的缓存存放于集群配置管理中。
3.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述步骤S101中的状态机用于控制发布事件给子模块,以及响应各模块处理结果。
4.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述步骤S205中Add/Unpend/UnpendDone事件为节点加入、解除、解除完成事件。
5.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述步骤S208中各子模块已完成Discard操作,业务代表统一触发各子模块配置模块中断I/O,进行首选节点切换,元数据更新和同步。
6.根据权利要求1所述的一种存储系统单节点故障快速恢复IO的方法,其特征在于,所述第二步之后减少通信或对表示层代码中的业务层代码的远程查询功能。
7.一种存储系统单节点故障快速恢复IO的装置,其特征在于,包括业务代表模块、存储业务子模块和集群事件管理模块;所述业务代表模块查询和调用业务接口执行业务,存储业务子模块向业务代表模块调用接口实现响应业务;所述业务代表模块作为中间代表连接存储业务子模块和集群事件管理模块,业务代表模块向外统一暴露接口;所述业务代表模块管理集群事件序列化,控制事件的统一发布和响应处理;
所述业务代表模块查询和调用业务接口执行业务,存储业务子模块向业务代表模块调用接口实现响应业务;所述业务代表模块作为中间代表连接存储业务子模块和集群事件管理模块,业务代表模块向外统一暴露接口,具体包括以下步骤:
S100、将需要处理的事件传输到业务代表的缓存中,所述缓存为创建于集群主机端与业务代表端进行数据通信的缓存;
S101、设置业务代表属性类以及状态机;
S102、控制启动状态机业务代表算法;
S103、等待集群单节点加入离开事件的发生,从业务代表的缓存中,将接收的事件读取到业务代表状态机,完成事件发布状态更新以及通知主机I/O的下发;
所述业务代表模块管理集群事件序列化,控制事件的统一发布和响应处理,具体包括以下步骤:
S200、节点离开时,集群生成Pend,发送到业务代表端,I/O栈业务子模块存活节点保持I/O,并在业务端处理因节点离开所需的事务处理;
S201、集群BOSS节点切换、重构视图后生成Remove事件,发送到业务代表端,业务代表判断各业务个子模块业务处理是否完成;
S202、业务代表监听I/O所有业务子模块处理完成,统一下发Remove事件到各业务配置管理模块,触发I/O开始中断;
S203、IO中断后,所有子模块一起进行首选节点切换,元数据更新同步操作,完成后通知业务代表;
S204、业务代表收到所有子模块配置更新完成后通知主机,立即恢复I/O;
S205、节点加入时,集群生成Add/Unpend/UnpendDone事件;
S206 、业务代表收到集群事件放到缓存中,Add触发状态机通知各子模块业务层进行Nodes属性更新等操作,同时存活节点保持I/O;
S207、更新完成后,通知业务代表,等待节点加入后集群Unpend事件的触发,业务代表触发子业务模块进行Discard操作,存活节点不做操作,继续保持I/O;
S208、集群完成视图重建操作发送UnpendDone事件到业务代表;
S209、业务代表收到所有子模块配置更新完成后通知主机,立即恢复I/O。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010987811.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:低划伤玻璃脱漆剂及其制备方法
- 下一篇:一种定位夹紧装置及方法