[发明专利]多控制器切换的方法、控制装置及系统有效
申请号: | 201010246316.0 | 申请日: | 2010-08-04 |
公开(公告)号: | CN101916217A | 公开(公告)日: | 2010-12-15 |
发明(设计)人: | 雷婷 | 申请(专利权)人: | 中兴通讯股份有限公司 |
主分类号: | G06F11/16 | 分类号: | G06F11/16;G06F3/06 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 胡海国;高丽晶 |
地址: | 518057 广东省深圳市南山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 控制器 切换 方法 控制 装置 系统 | ||
技术领域
本发明涉及存储技术领域,特别涉及一种多控制器切换的方法、控制装置及系统。
背景技术
磁盘阵列(Redundant Arry of Inexpensive,RAID)作为一种安全可靠的数据存储备份方式,在许多企业中被大量采用。但是,考虑磁盘阵列本身可能存在的安全性问题,则需要对其本身进行管理维护。
现有的磁盘阵列管理一般包括单控管理、双控管理及多控管理三种。其中,单控管理方式中磁盘阵列仅由一个控制器管理,虽然管理起来方便简单,但是当控制器出现故障时,将给整个系统造成严重影响。双控管理方式中磁盘阵列由两个控制器管理,一个控制器为主控制器,另外一个为备控制器。当主控制器出现故障时,将主控制器与备控制器进行切换。虽然一定程度提高了系统的可靠性和性能,但是当主控制器及备控制器同时出现故障时,却无法及时地恢复系统的正常运行。多控管理方式用于高端的大型的磁盘阵列管理,虽然可以通过多个控制器对磁盘阵列进行管理,但是如何通过多个控制器的配置和切换来进一步改变系统性能和可靠性成了一个亟待解决的问题。
发明内容
本发明的主要目的是提供一种多控制器切换方法、控制装置及系统,旨在提高管理磁盘阵列的效率及稳定性。
本发明提供了一种多控制器切换的系统,多控制器包括主控制器、从控制器及至少一个备控制器,其中所述主控制器、从控制器均为活动控制器,活动控制器与备控制器均用于管理磁盘阵列;所述活动控制器包括控制装置,所述控制装置进一步包括:
心跳监测模块,用于分别监测所有活动控制器的状态;
故障转移判断模块,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
切换模块,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将所述备控制器替换发生故障的活动控制器。
优选地,上述抢占模块还用于将抢占失败的活动控制器更新为从控制器,并等待主控制器唤醒。
优选地,上述控制装置还包括:
状态切换模块,用于当本活动控制器抢占结束后,更新本活动控制器的状态;还用于当是本活动控制器发生故障时,则更新所述发生故障的活动控制器的状态。
优选地,上述切换模块还包括:
控制单元,用于当本活动控制器抢占成功时,关闭发生故障的活动控制器;还用于唤醒从控制器继续工作,并更新系统的状态;
故障转移替换单元,用于当本活动控制器抢占成功时,根据故障转移预定策略选择备控制器,将发生故障的活动控制器的数据备份至所述备控制器,将备份好数据的备控制器替换发生故障的活动控制器。
优选地,上述控制装置还包括:
故障恢复判断模块,用于根据所有活动控制器的状态,判断是否有发生故障的活动控制器已恢复正常,是则判断是否为本活动控制器发生故障恢复;当判断不是本活动控制器发生故障恢复时,则判断本活动控制器是否为主控制器;
所述切换模块还包括:
故障恢复替换单元,用于当判断本活动控制器为主控制器时,根据故障恢复预定策略对故障恢复的活动控制器替换为从控制器或者保留为备控制器。
优选地,上述状态切换模块,还用于当判断是本活动活动控制器发生故障恢复时,更新所述发生故障恢复的活动控制器的状态,并等待主控制器替换或保留;还用于当判断不是本活动控制发生故障恢复时,更新本活动控制器的状态。
优选地,上述故障恢复判断模块还用于当判断本活动控制器不是主控制器时,则判断本活动控制器是否被替换;
所述故障恢复替换单元还用于当判断本活动控制器需要被替换时,则将本活动控制器的数据备份至故障恢复的活动控制器,将本活动控制器更新为备控制器;当判断本活动控制器不需要被替换时,则将故障恢复的活动控制器更新为备控制器。
本发明还提供了一种多控制器切换的控制装置,包括:
心跳监测模块,用于分别监测所有活动控制器的状态;
故障转移判断模块,用于根据所有活动控制器的状态,判断是否有活动控制器发生故障,当判断有活动控制器发生故障时,再判断是否为本活动控制器发生故障;
抢占模块,用于当不是本活动控制器发生故障时,则抢占硬件锁,并将抢占成功的活动控制器更新为主控制器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中兴通讯股份有限公司,未经中兴通讯股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010246316.0/2.html,转载请声明来源钻瓜专利网。