[发明专利]用于集群恢复的装置和方法有效
申请号: | 200780018545.3 | 申请日: | 2007-05-31 |
公开(公告)号: | CN101449246A | 公开(公告)日: | 2009-06-03 |
发明(设计)人: | C·B·比肯;S·马什雷德;R·B·尼科尔森 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/20 | 分类号: | G06F11/20;G06F11/00 |
代理公司: | 中国国际贸易促进委员会专利商标事务所 | 代理人: | 鲍 进 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 集群 恢复 装置 方法 | ||
技术领域
本发明涉及用于在高可用性集群软件(clustered software)中进行错误恢复的技术,特别涉及在存储网络控制器中进行错误恢复的技术。
背景技术
在高可用性集群软件中,多个节点协作以向用户提供服务。高可用性集群需要存在一些复制的状态或元数据信息,该信息由软件使用以便提供其特性。集群状态的内部一致对于产品的正确运行是至关重要的。关于内部一致,我们的意思是例如该软件中的不同层具有对对象数目的相同计数等等。
在高可用性集群软件中,希望保持100%的可用性或尽可能地接近该目标。但是,在代码中可能存在软件故障。软件错误恢复过程可用于高可用性集群软件。这些错误恢复过程使得在发生软件故障时集群能恢复。错误恢复过程被设计成确保内部状态保持一致。不幸的是,软件错误可导致集群状态的不一致,从而可以引起进一步的软件故障。有时仅仅当另一个故障发生时,才发现这些软件错误,这可导致在生产环境中大范围、高花费的停机。为了在这些软件错误发生时将其修复,采用修复来修补在集群状态中已识别的错误。但是,不可能保证在集群状态中没有进一步的未发现的缺陷。
为了保证作为之前集群恢复的结果的没有进一步的不一致,必须重新安装存储虚拟化软件并将集群状态重新初始化到其初始状态,但这是一种破坏性过程。重新安装的一个选择是运行层3(Tier 3)恢复程序(从归档存储中还原数据),这同样是破坏性的。另一个选择是建立新集群并将其配置成与原始集群相同。这将必须(通过利用例如主机镜像)传输数据。在某些系统中,可以进行这项操作而无需停止I/O。这种解决方案的缺点是花费高:需要额外的硬件(两倍的节点,额外的存储器),并且要求可观的资源利用来迁移到新集群。新硬件的引入也带来硬件故障的风险,硬件故障潜在地增大问题。
因此,希望有一种技术手段,用于以非破坏性和不依赖于系统以及存储管理者的时间和努力形式的额外硬件和资源的方式,在高可用性集群软件中进行错误恢复。
发明内容
因此,本发明的第一方面提供了一种用于在集群系统中进行非破坏性错误恢复的装置,包括:节点实例配置活动停顿(quiesce)组件,用于停顿在第一虚拟节点实例处的配置活动;节点实例创建组件,用于创建I/O访问被阻塞的第二虚拟节点实例;节点实例配置传送组件,用于从所述第一虚拟节点实例向所述第二虚拟节点实例传送配置数据;提交(commit)组件,用于提交从所述第一虚拟节点实例到所述第二虚拟节点实例的转换;节点实例通信阻塞组件,用于阻塞进入第一虚拟节点实例的通信;节点实例通信解阻塞(unblock)组件,用于解阻塞在所述第二虚拟节点实例处的I/O访问;通信控制组件,用于监控从所述第一虚拟节点实例外发的通信并信号发送关于所有未决的外发通信的完成;以及节点实例删除组件,用于删除所述第一虚拟节点实例。
优选地,单个指导器(director)组件控制所述停顿组件、所述节点实例创建组件、所述节点实例配置传送组件、所述提交组件、所述节点实例通信阻塞组件、所述节点实例通信解阻塞组件、所述通信控制组件和所述节点实例删除组件。
优选地,所述单个指导器组件可与一个或多个过滤器组件协作以控制所述停顿组件、所述节点实例创建组件、所述节点实例配置传送组件、所述提交组件、所述节点实例通信阻塞组件、所述节点实例通信解阻塞组件、所述通信控制组件和所述节点实例删除组件中的一个或多个组件。
在优选实施例中,集群系统包括根据所述第一方面的装置。
在优选实施例中,存储虚拟化系统包括根据所述第一方面的装置。
本发明的第二方面提供了一种用于在集群系统中执行非破坏性错误恢复的方法或逻辑配置,包括以下步骤:停顿在第一虚拟节点实例处的配置活动;创建I/O访问被阻塞的第二虚拟节点实例;从所述第一虚拟节点实例向所述第二虚拟节点实例传送配置数据;提交从所述第一虚拟节点实例向所述第二虚拟节点实例的转换;阻塞进入第一虚拟节点实例的通信;解阻塞在所述第二虚拟节点实例处的I/O访问;监控从所述第一虚拟节点实例外发的通信并信号发送关于所有未决的外发通信的完成;以及删除所述第一虚拟节点实例。
优选地,单个指导组件控制所述停顿、创建、传送、提交、阻塞、解阻塞、监控、信号发送以及删除步骤。
优选地,所述单个指导组件可与一个或多个过滤器组件协作以控制所述停顿、创建、传送、提交、阻塞、解阻塞、监控、信号发送以及删除步骤中的一个或多个步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780018545.3/2.html,转载请声明来源钻瓜专利网。