[发明专利]一种云端集群故障处理方法及装置在审
申请号: | 201711204632.X | 申请日: | 2017-11-27 |
公开(公告)号: | CN109842505A | 公开(公告)日: | 2019-06-04 |
发明(设计)人: | 牛建华;吴亮;赵安安;孙净亮;彭朝阳;曾重阳 | 申请(专利权)人: | 北京通号国铁城市轨道技术有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;李相雨 |
地址: | 100070 北京市丰*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标主机 云端 集群 备用主机 服务切换 故障处理 心跳信息 接管 预设时间段 运行效率 离线 重启 修复 服务 恢复 | ||
1.一种云端集群故障处理方法,其特征在于,包括:
云端集群的备用主机若在预设时间段内未接收到目标主机的心跳信息,则确认所述目标主机故障;
接管所述目标主机的服务继续运行,以使所述目标主机进行离线重启或修复;
若接收到所述目标主机的心跳信息,则确认所述目标主机恢复正常,并将运行的各服务切换回所述目标主机运行。
2.根据权利要求1所述的方法,其特征在于,所述云端集群的备用主机在预设时间段内未接收到目标主机的心跳信息,则确认所述目标主机故障之前,还包括:
云端集群的备用主机通过主心跳线接收到目标主机的心跳信息,若所述主心跳线故障,则通过备心跳线接收到目标主机的心跳信息。
3.根据权利要求1所述的方法,其特征在于,所述心跳消息包括主机硬件心跳信息、主机网络心跳信息、主机操作系统心跳信息、应用程序心跳信息以及主机与磁盘阵列连线心跳信息。
4.根据权利要求1-3任一项所述的方法,其特征在于,所述方法还包括:
设定心跳配置文件中心跳信息的侦测时间间隔和侦测次数,并根据所述心跳配置文件接收到目标主机的心跳信息。
5.一种云端集群故障处理装置,其特征在于,包括:
故障确认模块,用于若在预设时间段内未接收到目标主机的心跳信息,则确认所述目标主机故障;
服务接管模块,用于接管所述目标主机的服务继续运行,以使所述目标主机进行离线重启或修复;
服务恢复模块,用于若接收到所述目标主机的心跳信息,则确认所述目标主机恢复正常,并将运行的各服务切换回所述目标主机运行。
6.根据权利要求5所述的装置,其特征在于,所述装置还包括:
心跳接收模块,用于通过主心跳线接收到目标主机的心跳信息,若所述主心跳线故障,则通过备心跳线接收到目标主机的心跳信息。
7.根据权利要求5所述的装置,其特征在于,所述心跳消息包括主机硬件心跳信息、主机网络心跳信息、主机操作系统心跳信息、应用程序心跳信息以及主机与磁盘阵列连线心跳信息。
8.根据权利要求5-7任一项所述的装置,其特征在于,所述装置还包括:
文件设定模块,用于设定心跳配置文件中心跳信息的侦测时间间隔和侦测次数,并根据所述心跳配置文件接收到目标主机的心跳信息。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至4任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机程序,所述计算机程序使所述计算机执行如权利要求1至4任一所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京通号国铁城市轨道技术有限公司,未经北京通号国铁城市轨道技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711204632.X/1.html,转载请声明来源钻瓜专利网。