[发明专利]一种磁盘阵列主动故障处理系统设计方法无效
申请号: | 201210439989.7 | 申请日: | 2012-11-07 |
公开(公告)号: | CN102981920A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 陈宗勇;唐远琳 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 250014 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 磁盘阵列 主动 故障 处理 系统 设计 方法 | ||
技术领域
本发明涉及磁盘阵列故障处理领域,具体涉及一种磁盘阵列主动故障处理系统。
背景技术
存储系统的可靠性是对存储系统最基本的要求。磁盘阵列是组建大型存储系统的关键基础设备,磁盘阵列的可靠性对于所构建的大型存储系统至关重要。磁盘阵列控制器承担着存储介质管理,缓存管理及接收并执行主机命令的功能,是磁盘阵列的核心部件。控制器的可靠性决定磁盘阵列的可靠性,而故障是影响其可靠性的重要因素,控制器故障处理系统是保证磁盘阵列可靠性的核心模块。因此,设计优秀的阵列控制器的故障处理系统是保证存储系统可靠性的重要手段。为了提高该磁盘阵列的可靠性,本文设计了一种磁盘阵列主动故障处理系统。
发明内容
本发明的目的是提供一种磁盘阵列主动故障处理系统设计方法。
本发明的目的是按以下方式实现的,包括主系统和主动故障处理系统,主动故障处理系统包括故障检测模块、过程接管模块和故障处理模块,主动故障处理系统根据主系统磁盘阵列的组成和命令执行过程,监控命令的执行过程并主动检测发生的故障,当检测到故障发生时,主动故障处理系统能够主动进行处理,主动故障处理系统的存在能够显著提高磁盘阵列系统的可靠性,并降低了开发的难度;
主动故障处理系统与主系统之间相对独立运行,主系统命令执行的每一个阶段都主动到主动故障处理系统中进行注册,主动故障处理系统保存注册的命令执行信息,并采集资源分配及释放状况、命令元数据的健康状况等信息,井将这些信息统一提供给故障检测模块;
故障检测模块是故障检测的专门系统,它负责管理故障模型、检测系统故障;
故障处理步骤如下:
故障检测模块检测到故障发生后将启动过程接管模块和故障处理模块,其中,过程接管模块负责接管与故障相关联的所有资源,并主动将其锁定,全面接管相关命令的执行权限,控制命令的执行和资源的管理,故障处理模块接管由过程接管模块移交过来的故障和相关资源后,实时处理相关的故障,处理方法的选择由故障的类型决定,由于故障处理模块完全独立于主作业系统,因此,当系统检测到主系统停机的较重大的故障时,故障处理模块能够实时恢复主系统的运行。
本发明的有益效果是:该系统根据磁盘阵列的组成模块和命令执行过程,主动获得并监控命令的执行过程和故障发生的情况。当故障发生时,主动故障处理系统能够主动的进行处理。主动故障处理系统能够显著提高磁盘阵列系统的可靠性,并降低了开发的难度。
附图说明
图1是读命令处理流程图;
图2是写命令处理流程图;
图3是传统通常故障处理流程图;
图4是主动故障处理流程图。
具体实施方式
参照说明书附图对本发明的方法作以下详细地说明。
磁盘阵列控制器系统运行时,最主要的任务是处理由上行主机发起的I/O(输入输出命令)。其中I/O命令可以分为3类:第1类是读命令,如图1所示,包括READ命令、NQURY命令,REFORTLUNS命令等,该类命令的特征是磁盘阵列需要向上行主机返回数据;第2类是写命令,如图2所示,包括WRITE命令等,该类命令的特征是上行主机需要向磁盘阵列发送数据;第3类命令是无数据命令,该类命令的特征是上行主机与磁盘阵列之间不发生数据交换。
这3类命令故障处理的方式不同,通常的故障处理方式是当系统发现故障时,则跳转到相应的故障处理程序分支中去,如图3所示。这种方法主要的缺点有以下几点:
(1)故障处理程序是针对特定故障的,如READ故障。因此在各个故障点上的故障处理程序是不同的,这样增加了开发难度;
(2)故障处理是被动的。故障检测和启动故障处理程序是由主系统来完成的;
(3)故障处理模块与主系统紧密藕合,当出现系统无法检测的故障时,例如主程序死锁等,故障处理程序同时失效。
主动故障处理系统的结构原理如图4所示。它与上行主机的主系统之间相对独立运行,主系统命令执行的每一个阶段都主动到故障处理系统中进行注册,故障处理系统保存注册的命令执行信息,并采集资源分配及释放状况、命令元数据的健康状况等信息,井将这些信息统一提供给故障检测模块。
故障检测模块是故障检测的专门系统,它负责管理故障模型、检测系统故障。
故障检测模块检测到故障发生后将启动过程接管和故障处理模块。其中,过程接管模块负责接管与故障相关联的所有资源,并主动将其锁定,全面接管相关命令的执行权限,控制命令的执行和资源的管理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210439989.7/2.html,转载请声明来源钻瓜专利网。