[发明专利]提供用于HA集群的管理程序的基于应用的监控及恢复有效
申请号: | 201380018522.8 | 申请日: | 2013-03-26 |
公开(公告)号: | CN104205060A | 公开(公告)日: | 2014-12-10 |
发明(设计)人: | M·穆勒;M·米特尔施塔特;R·E·哈珀;L·F·斯帕诺维尔 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F11/16 | 分类号: | G06F11/16;G06F9/46;G06F11/30 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘薇;于静 |
地址: | 美国*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提供 用于 ha 集群 管理程序 基于 应用 监控 恢复 | ||
1.一种方法,与第一节点相关联,所述第一节点包括管理程序和一个或多个来宾虚拟机(VM),其中每个来宾虚拟机被安排以运行一个或多个应用,所述第一节点与一个或多个其它节点一起形成高可用性(HA)集群,所述方法包括以下步骤:
在所述第一节点的每个来宾虚拟机和管理程序之间,建立内部双向通信通道;
在所述管理程序和给定来宾虚拟机之间,通过所述内部通道发送包括命令和对命令的响应的消息,其中,各个命令被发送以管理在所述给定来宾虚拟机上运行的指定应用;
有选择地监控所述消息,以检测与在所述给定来宾虚拟机上运行的所述指定应用相关联的故障状态的发生;以及
响应于检测到故障状态,采取措施以纠正所述故障状态,其中,所述措施包括通过所述内部通道将至少一个命令从所述管理程序发送到所述给定来宾虚拟机。
2.根据权利要求1所述的方法,其中,
每个所述内部双向通道建立在与一个所述来宾虚拟机相关联的应用可用性管理器和所述第一节点的所述管理程序之间。
3.根据权利要求1所述的方法,其中,所述纠正的措施选择性地包括:
通过所述内部通道,将命令序列从所述管理程序发送到所述给定来宾虚拟机,以停止在所述给定来宾虚拟机上运行的所述指定应用,然后,在所述第一节点中,在所述给定来宾虚拟机上重新启动所述指定应用;或者
实现所述指定应用的故障转移到所述第一节点的除了所述给定来宾虚拟机之外的另一个来宾虚拟机,并在所述另一个来宾虚拟机上运行所述指定应用。
4.根据权利要求3所述的方法,其中,
在故障转移到所述另一个来宾虚拟机之前,所述另一个来宾虚拟机的指定组件被用作复制接收器;在故障转移到所述另一个来宾虚拟机之后,响应于通过所述内部通道从所述管理程序发送到所述另一个来宾虚拟机的命令,所述另一个来宾虚拟机的所述指定组件被用作复制发送器。
5.根据权利要求4所述的方法,其中,
在故障转移到所述另一个来宾虚拟机之后,进入数据被路由到所述另一个来宾虚拟机,并被所述复制发送器复制到与所述另一个来宾虚拟机相关联的存储器,所述给定来宾虚拟机的指定组件被用作复制接收器。
6.根据权利要求1所述的方法,其中,所述纠正的措施包括:
实现所述指定应用和所述给定来宾虚拟机的故障转移到所述高可用性集群的第二节点,以及在所述第二节点中,在所述给定来宾虚拟机上运行所述指定应用。
7.根据权利要求1所述的方法,其中,所述纠正的措施包括:
实现所述指定应用的故障转移到所述高可用性集群的第二节点,以及在所述第二节点中,在除了所述给定来宾虚拟机之外的来宾虚拟机上运行所述指定应用。
8.根据权利要求1所述的方法,其中,
在所述给定来宾虚拟机上运行的所述指定应用由与所述管理程序相关联的高可用性集群管理器管理,其中,所述高可用性集群管理器要求指定的管理脚本和配置资源以用于其运行,并且所有所述脚本和配置都包括在所述管理程序中。
9.根据权利要求1所述的方法,其中,
所述高可用性集群具备用于监控由所述高可用性集群的各个节点产生的心跳的系统,其中,节点的故障通过由此产生的所述心跳的缺陷指示。
10.根据权利要求1所述的方法,其中,
所述高可用性集群的每个节点具有本地高可用性管理器,其中,节点中的来宾虚拟机故障由其高可用性管理器检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司;,未经国际商业机器公司;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201380018522.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信息处理设备
- 下一篇:存储系统和存储控制装置