[发明专利]一种故障处理方法及装置在审
申请号: | 202110396996.2 | 申请日: | 2021-04-13 |
公开(公告)号: | CN115202803A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 肖磊;李秀桥;孙宏伟;阮涵 | 申请(专利权)人: | 超聚变数字技术有限公司 |
主分类号: | G06F9/455 | 分类号: | G06F9/455 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 450046 河南省郑州市郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 故障 处理 方法 装置 | ||
本申请提供一种故障处理方法及装置,涉及集群的故障处理领域。该方法应用的VM集群包括管理节点、第一存储节点和多个VM,该方法包括:管理节点从保存有每个VM的状态的第一存储节点中获取多个VM的状态,若该多个VM中至少一个VM为故障状态,管理节点指示VM集群中的主机重新启动至少一个故障VM,该主机包括承载故障VM的主机和VM集群中除承载故障VM的主机之外的其他主机。本方法将VM集群中的部分存储空间作为统一的地址空间,并由包括该地址空间的第一存储节点保存每个VM的状态,管理节点从该第一存储节点中获取多个VM的状态,避免了管理节点与VM集群中每个主机进行通信,减少了管理节点获取VM的状态的时间。
技术领域
本申请涉及集群的故障处理领域,尤其涉及一种故障处理方法及装置。
背景技术
虚拟机(virtual machine,VM)指通过软件模拟的具有完整硬件系统功能的、运行在一个完全隔离环境中的计算机系统。虚拟机集群是指一个包含管理节点和部署在不同主机上的多个虚拟计算机的系统,管理节点用于监控VM的运行状态。
目前,主机可以监控运行的VM,管理节点需要与每个主机进行通信,从主机获取VM的运行状态。若VM故障,管理节点指示主机重新启动故障VM。若主机发生故障,则主机无法正常运行VM,管理节点在其他的健康主机上重新启动故障主机所承载的VM,以确保VM的正常运行,实现VM集群的高可用(high availability,HA)。由于管理节点需要与每个主机进行通信,导致VM集群的故障检测时间较长,VM的恢复时间较长。因此,如何快速地检测VM的故障是目前亟需解决的问题。
发明内容
本申请提供一种故障处理方法及装置,解决了现有技术中VM的故障检测速度较慢的问题。
为达到上述目的,本申请采用如下技术方案。
第一方面,本申请实施例提供一种故障处理方法,该方法应用于VM集群的管理节点,或者该方法可应用于可以支持实现该方法的通信设备,例如该通信设备包括芯片系统。在一种可能的设计中,该VM集群还包括第一存储节点和多个VM,该方法包括:管理节点从保存有VM集群中每个VM的状态的第一存储节点中获取多个VM的状态,在该多个VM中至少一个VM的状态为故障状态的情况下,管理节点指示VM集群中的主机重新启动至少一个故障VM,该VM集群中的主机包括承载故障VM的主机和VM集群中除承载故障VM的主机之外的其他主机。由于本申请实施例提供的故障处理方法将VM集群中的一部分存储空间作为统一的地址空间,并由包括该地址空间的第一存储节点保存VM集群中每个VM的状态,管理节点可以从第一存储节点的地址空间中获取多个VM的状态,避免了管理节点与VM集群中每个主机进行通信,减少了管理节点获取VM集群中所有VM的状态的时间,提高了VM集群的故障恢复效率。
在一种可选的实现方式中,管理节点从第一存储节点获取多个VM的状态,包括:管理节点向第一存储节点发送第一请求,该第一请求用于指示第一存储节点上报多个VM的状态;管理节点接收第一存储节点发送的多个VM的状态。相较于现有技术中管理节点需要与每个主机进行通信,才能获取到VM集群中所有VM的状态,本申请实施例所提供的故障处理方法,管理节点仅需与第一存储节点进行通信,减少了管理节点进行故障检测所需的通信次数,降低了网络通信所需的时间,提高了VM集群的故障检测效率。
在另一种可选的实现方式中,管理节点从第一存储节点获取多个VM的状态,包括:管理节点接收第一存储节点周期性地发送的多个VM的状态。管理节点可以从第一存储节点周期性获取到VM集群中每个VM的状态,减少了管理节点与主机的通信次数以及VM集群的故障检测时间。
在另一种可选的实现方式中,第一存储节点还用于保存VM集群中每个主机的硬件设备地址,该方法还包括:管理节点从第一存储节点获取承载故障VM的主机的硬件设备地址;若承载故障VM的主机故障,管理节点依据硬件设备地址确定VM集群中除承载故障VM的主机之外的其他主机。该硬件设备地址可以包括故障主机在第一存储节点中的标识,故障主机的地址以及故障主机的设备在故障主机中的地址。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于超聚变数字技术有限公司,未经超聚变数字技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110396996.2/2.html,转载请声明来源钻瓜专利网。