[发明专利]一种用于多控制器存储系统的故障处理方法和系统有效
申请号: | 201610082649.1 | 申请日: | 2016-02-05 |
公开(公告)号: | CN105786666B | 公开(公告)日: | 2019-05-10 |
发明(设计)人: | 赵鹏;卓保特 | 申请(专利权)人: | 浪潮(北京)电子信息产业有限公司 |
主分类号: | G06F11/22 | 分类号: | G06F11/22 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 100085 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 控制器 存储系统 故障 处理 方法 系统 | ||
本发明实施例提供一种用于多控制器存储系统的故障处理方法和系统,其中方法包括:当从控制器向主控制器传输数据时,若HA模块检测到主控制器宕机,则向从控制器内从MCC通信模块发送异常终止信号,从MCC通信模块接收该异常终止信息后,调用该从控制器内从IOM模块停止发送数据,并将写入失败数据和未发送数据返回该从IOM模块,从IOM模块将该写入失败数据和未发送数据添加至阻塞队列上层,并对SCST模块还未下发的数据进行阻塞,SCST模块每隔预设时间间隔对该阻塞队列中数据按照预设顺序进行下发,直到该阻塞队列中数据被主控制器写入后端磁盘。保证了写入数据的完整性和多控制器存储系统的稳定性,且具有较高的数据写入效率。
技术领域
本发明涉及故障处理技术领域,特别是涉及一种用于多控制器存储系统的故障处理方法和系统。
背景技术
目前,在多控制器存储存储系统中,当SCST模块(主机接口层模块)通过从控制器向后端磁盘写入数据时,需要从控制器在接收到SCST模块下发的数据后,先将这些需要写入后端磁盘的数据发送给主控制器,然后由主控制器将这些需要写入的数据写入后端磁盘。然而,在目前的多控制器存储系统中,若主控制器在从控制器向其发送数据的过程中发生宕机,主控制器上的数据传输流程将因为宕机而被终止,致使需要写入的数据无法继续写入后端磁盘。
目前,通常通过在多控制器存储系统中设置超时等待处理机制来解决上述问题。设置主控制器在将数据写入后端磁盘后向从控制器发送数据写入反馈,若从控制器将某数据发送给主控制器后,未在预设时间内接收到该数据相对应的数据写入反馈,则向主机重新发送该数据。然而,由于SCST模块持续向从控制器发送数据,该数据也持续由从控制器向主控制器发送,通过在多控制器存储系统中设置超时等待处理机制来解决上述问题,将可能导致先发送的数据由于主控制器宕机未能成功写入磁盘,而后发送的数据被先写入后端磁盘,先发送的数据由于超时重发机制而后于后发送的数据被写入后排磁盘中的情况发生。如此,将可能破坏写入数据的完整性和该多控制器存储系统的稳定性。同时,由于在多控制器存储系统设置的超时等待时间往往较长,一般设置超时等待时间为120秒,因此,若通过在多控制器存储系统中设置超时等待处理机制来解决上述问题,由于超时等待时间过长,也将影响到数据写入效率。
发明内容
有鉴于此,本发明实施例提供一种用于多控制器存储系统的故障处理方法和系统,以解决现有技术中设置超时等待处理机制来解决多控制器间中主从控制器间通信故障问题,将可能破坏写入数据的完整性和该多控制器存储系统的稳定性,同时,造成等待时间过长,影响数据写入效率的问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种用于多控制器存储系统的故障处理方法,包括:
当从控制器向主控制器传输数据时,由HA模块检测所述主控制器是否宕机,若所述HA模块检测到所述主控制器宕机,则向所述从控制器内从MCC通信模块发送异常终止信号;
所述从MCC通信模块接收到所述异常终止信号后,调用所述从控制器内从IOM模块停止向所述从MCC通信模块发送数据,并将已发送至所述主控制器但还未被所述主控制器写入后端磁盘的写入失败数据和还未发送至所述主控制器的未发送数据返回所述从IOM模块;
所述从IOM模块将所述写入失败数据和所述未发送数据添加至阻塞队列上层,并对SCST模块还未下发的数据进行阻塞;
所述SCST模块每隔预设时间间隔对所述阻塞队列中数据按照预设顺序进行下发,直到所述阻塞队列中数据被所述主控制器写入后端磁盘。
其中,所述从控制器向主控制器传输数据包括:
所述从控制器内从IOM模块接收所述SCST模块下发的数据,将所述SCST模块下发的数据发送给所述从控制器内从MCC通信模块;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮(北京)电子信息产业有限公司,未经浪潮(北京)电子信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610082649.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:计算机硬件端口智能管控装置
- 下一篇:一种虚拟机备份数据重复数据删除方法