[发明专利]监控虚拟机集群的方法和系统有效
申请号: | 201510703270.3 | 申请日: | 2015-10-26 |
公开(公告)号: | CN105357038B | 公开(公告)日: | 2019-05-07 |
发明(设计)人: | 刘虎 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L12/26;H04L29/08 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 监控 虚拟机 集群 方法 系统 | ||
1.一种监控虚拟机集群的方法,其特征在于,所述方法包括:
第一物理机间隔第一预设时间向虚拟机集群中的虚拟机发送虚拟机状态参数查询指令;
所述虚拟机响应于接收到所述查询指令,向所述第一物理机发送响应信息;
所述第一物理机响应于未接收到所述响应信息的时间长度大于第二预设时间,确定虚拟机发生故障,判断发生故障的虚拟机是否满足预设的重启条件,若发生故障的虚拟机满足预设的重启条件,发送重启虚拟机指令给运行所述发生故障的虚拟机的第二物理机;
所述第二物理机根据所述重启虚拟机指令,重启所述发生故障的虚拟机;
所述第二物理机在重启所述发生故障的虚拟机时,发送重启响应信号至所述第一物理机;
所述第一物理机响应于接收到所述重启响应信号,从预先记录的虚拟机的元信息中获取发生故障的虚拟机的地址,根据所述地址,连接所述重启的虚拟机,发送重启第一服务进程信号至所述重启的虚拟机;
所述重启的虚拟机根据所述重启第一服务进程信号,启动所述重启的虚拟机的服务进程。
2.根据权利要求1所述的方法,其特征在于,所述若发生故障的虚拟机满足预设的重启条件,发送重启虚拟机指令给运行所述发生故障的虚拟机的第二物理机包括:
若发生故障的虚拟机的比例小于预设比例,发送重启虚拟机指令给所述第二物理机;或
若发生故障的虚拟机距上一次重启或重建虚拟机的时间超过第三预设时间,发送重启虚拟机指令给所述第二物理机。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
所述第一物理机响应于发送所述重启虚拟机指令后预定时间内未接收到所述重启响应信号,确定重启所述发生故障的虚拟机失败,响应于重启失败的次数达到预设次数,发送重建虚拟机指令至第三物理机,其中,所述第三物理机为所述虚拟机集群的宿主物理机集群中除所述第二物理机之外的物理机;
所述第三物理机根据所述重建虚拟机指令,重建所述发生故障的虚拟机。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
所述第三物理机发送重建响应信号至所述第一物理机;
所述第一物理机响应于接收到所述重建响应信号,从所述虚拟机的元信息中获取发生故障的虚拟机的元信息,根据获取的元信息,发送节点恢复指令至所述重建的虚拟机;
所述重建的虚拟机若根据所述节点恢复指令确定所述重建的虚拟机为管理节点,则根据所述节点恢复指令,从远程存储下载预先备份的关联原管理节点的增量数据,基于所述增量数据,恢复所述重建的管理节点的元数据,接受所述虚拟机集群中的计算节点注册,若根据所述节点恢复指令确定所述重建的虚拟机为计算节点,则根据所述节点恢复指令,向所述虚拟机集群中的管理节点注册。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
所述重建的管理节点响应于预定时间内注册的所述虚拟机集群中的计算节点大于或等于预设比例,确定重建成功,发送指示重建成功的信号至所述第一物理机,响应于预定时间内注册的所述虚拟机集群中的计算节点低于预设比例,发送指示重建失败的报警信号至所述第一物理机;
所述第一物理机根据所述指示重建成功的信号,向所述重建的管理节点提交接收的用户作业,根据所述指示重建失败的报警信号,呈现报警提示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510703270.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种冷室压铸机锤头润滑装置
- 下一篇:用于小方坯连铸机的结晶器对弧样板