[发明专利]一种磁盘阵列控制器故障处理方法及系统无效
申请号: | 201010190194.8 | 申请日: | 2010-06-02 |
公开(公告)号: | CN101887386A | 公开(公告)日: | 2010-11-17 |
发明(设计)人: | 王卫斌 | 申请(专利权)人: | 深圳市迪菲特科技股份有限公司 |
主分类号: | G06F11/07 | 分类号: | G06F11/07;G06F3/06 |
代理公司: | 广州三环专利代理有限公司 44202 | 代理人: | 郝传鑫;潘中毅 |
地址: | 518000 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 磁盘阵列 控制器 故障 处理 方法 系统 | ||
技术领域
本发明涉及计算机电子领域,尤其涉及一种磁盘阵列控制器故障处理方法及系统。
背景技术
RAID是“Redundant Array of Independent Disk”的缩写,中文意思是磁盘阵列存储系统。磁盘阵列技术诞生于1987年,由美国加州大学伯克利分校提出。简单地解释,就是将N台硬盘通过磁盘阵列控制器(RAID Controller)结合成虚拟单台大容量的硬盘使用。RAID的采用为存储系统(或者服务器的内置存储)带来巨大利益,其中提高传输速率和提供容错功能是最大的优点。
磁盘阵列存储系统的核心是磁盘阵列控制器。磁盘阵列控制器是主机和磁盘之间的数据传输通路,包含面向主机和磁盘阵列两个方面的接口。磁盘阵列控制器处理来自主机和磁盘阵列的信息,通过对多个磁盘成员的并行操作,提供远高于单独磁盘的传输速率,从而匹配数据前端和磁盘设备之间的数据传输速度,使其达到均衡。
磁盘阵列控制器作为磁盘阵列系统的核心,其可靠性直接关系到磁盘阵列的可用性。磁盘阵列控制器是一个复杂的控制系统,具有专用的软硬件平台,因此具有嵌入式系统难以测试的特征。
磁盘阵列作为数据存储的终端节点,需要快速响应来自存储网络或主机的大量数据存储请求,为了保证系统具有极高的I/O吞吐率,磁盘阵列控制器的任务由大量并发的工作线程相互协作完成的。因此,磁盘阵列控制器具有任务密集、并发度高的特征。
本发明人在实施本发明的过程中发现,磁盘阵列控制器因为其复杂性导致其可靠性下降,为了保证磁盘阵列控制器长期、高效的运行,必须要使其具备容错能力。
在现有的方法中,通常采用硬件冗余技术来提高其容错能力,这种方式实现需要较高的成本。而通过软件技术保障其可靠性的方法,通常是将故障处理逻辑融合在磁盘阵列控制器业务处理过程中,当磁盘阵列控制器发现故障时,则跳转到相应的故障处理程序分支中去,但是这种方式所能处理的故障有限,并且进一步增加了磁盘阵列控制器的复杂度,难以维护。
发明内容
本发明实施例所要解决的技术问题在于,提供一种磁盘阵列控制器故障处理方法及系统,独立、主动的监控磁盘阵列控制器的运行过程,主动检测磁盘阵列控制器故障并及时进行故障处理。同时,在磁盘阵列控制器发生故障时,磁盘阵列控制器故障处理系统能够保证磁盘阵列控制器不会因为任何故障造成资源泄漏、模块失效甚至宕机等错误。
为了解决上述技术问题,本发明实施例提供了一种磁盘阵列控制器故障处理方法,包括:
接收磁盘阵列控制器在其任务执行的各个阶段,主动注册的运行状态;
根据所述磁盘阵列控制器的运行状态,判断所述磁盘阵列控制器在所述任务执行过程中是否出现故障;
若所述判断为是,则接管所述任务,并按照预定的故障处理程序处理所述故障。
其中,所述接收磁盘阵列控制器在其任务执行的各个阶段,主动注册的运行状态之前,还包括:
预设所述磁盘阵列控制器的各类任务在各个阶段的运行状态模型;所述磁盘阵列控制器的任务类型包括:读数据任务、写数据任务和无数据任务。
其中,所述根据所述磁盘阵列控制器的运行状态,判断所述磁盘阵列控制器在所述任务执行过程中是否出现故障,包括:
根据所述磁盘阵列控制器主动注册的运行状态,查找其当前任务在当前阶段的运行状态模型;
判断所述磁盘阵列控制器主动注册的运行状态,是否符合查找得到的运行状态模型。
其中,所述运行状态模型中包括:所述磁盘阵列控制器的各类任务在各个阶段之间的时间间隔;
则所述根据所述磁盘阵列控制器的运行状态,判断所述磁盘阵列控制器在所述任务执行过程中是否出现故障,还包括:判断所述磁盘阵列控制器主动注册运行状态后,在对应运行状态模型规定的时间间隔内,是否收到下一次运行状态的注册。
其中,所述按照预定的故障处理程序处理所述故障中,所述预定的故障处理程序包括:
任务回滚,控制执行过程中出现故障的任务回到前一个注册的运行状态中,重新执行所述任务;
任务终止,终止任务的继续运行、记录错误日志并对任务发起方反馈错误信息;
系统安全关闭,将磁盘阵列控制器缓存的数据回写到非易失存储介质中,安全的关闭所述磁盘阵列控制器。
相应地,本发明实施例还提供一种磁盘阵列控制器故障处理系统,包括:
信息收集模块,用于接收磁盘阵列控制器在其任务执行的各个阶段,主动注册的运行状态;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市迪菲特科技股份有限公司,未经深圳市迪菲特科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010190194.8/2.html,转载请声明来源钻瓜专利网。