[发明专利]虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法有效
申请号: | 201510416209.0 | 申请日: | 2015-07-15 |
公开(公告)号: | CN105024879B | 公开(公告)日: | 2018-03-23 |
发明(设计)人: | 徐士伟;江昌庆;胡哲琨;代征;戴新发 | 申请(专利权)人: | 中国船舶重工集团公司第七0九研究所 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;H04L29/08;G06F9/455;G06F11/30 |
代理公司: | 武汉河山金堂专利事务所(普通合伙)42212 | 代理人: | 胡清堂 |
地址: | 430205 湖北省武汉市*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 虚拟机 故障 检测 恢复 系统 启动 方法 | ||
技术领域
本发明涉及虚拟化高可用技术领域,特别涉及一种虚拟机故障检测、恢复系统及虚拟机检测、恢复、启动方法。
背景技术
随着信息技术的发展和人们对计算机资源不断提高的要求,云计算已经成为当前计算机技术研究的热点。云计算使用虚拟化技术对底层计算、网络和存储资源进行封装,通过建立虚拟机并在其中运行操作系统和应用程序的形式,将这些资源提供给远程用户。因此,虚拟机作为用户直接使用的环境,其稳定性和可用性直接关系到用户的使用体验。
在云计算虚拟化平台上,虚拟机管理器(Virtual Machine Monitor,VMM)是整个系统的核心部件。在通常情况下,VMM直接运行在硬件平台之上,以软件方式模拟物理硬件的核心功能,建立多个虚拟机(Virtual Machine,VM),并且为运行在这些虚拟机之上的操作系统和应用程序提供与访问物理硬件相同的访问接口。与普通计算机相同,虚拟机的系统在运行过程中会出现故障(例如:死机和蓝屏等),当虚拟机系统发生故障时,用户程序和业务将无法运行。这样,为了保证业务处理功能的正常实现,需要能够检测和恢复虚拟机系统故障的方法。
为了解决虚拟机系统故障检测的问题,已有研究人员借鉴计算机集群的高可用方案,在虚拟环境下引入心跳检测机制,利用网络连接传递虚拟机和VMM之间的心跳信息,通过让虚拟机和VMM之间保持心跳的方式,检测虚拟机是否发生故障。但是网络环境复杂并且充满了不可预期的因素,这降低了虚拟机和VMM之间心跳的稳定性,增加了虚拟机故障的漏报和误报的概率。
发明内容
有鉴于此,本发明提供一种虚拟机故障检测、恢复系统及其检测、恢复、启动方法。
一种虚拟机故障检测和恢复的系统,其包括至少一台虚拟机以及一台虚拟机管理器;虚拟机运行在虚拟机管理器之上;
虚拟机内设置虚拟机故障检测前端(Fault-detection Front End,FDFE),虚拟机故障检测前端用于检测虚拟机的心跳信息,并将心跳信息发送至虚拟机管理器;
虚拟机管理器包括虚拟机故障检测配置模块(Fault-detection Configuration Module,FDCM)、域间共享存储系统(Domain-shared Storage System,DS3)、与虚拟机故障检测前端对应的虚拟机故障检测后端(Fault-detection Back End,FDBE)、虚拟机故障检测管理模块(Fault-detection Management Module,FDMM);
虚拟机故障检测配置模块用于接收并存储用户指定的虚拟机故障检测配置信息;
域间共享存储系统用于接收并存储虚拟机管理发送的心跳信息;
虚拟机故障检测管理模块用于读取虚拟机故障检测配置信息,并根据虚拟机故障检测配置信息向虚拟机故障检测后端发送检测启动指令;虚拟机故障检测管理模块还用于在虚拟机发生故障时,关闭发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端,并重新启动发生故障的虚拟机以及发生故障的虚拟机对应的故障检测后端;
虚拟机故障检测后端用于根据检测启动指令从域间共享存储系统中读取心跳信息,并根据心跳信息判断虚拟机是否发生故障,并将检测结果发送至虚拟机故障检测管理模块。
一种虚拟机故障检测和恢复的方法,其通过上述虚拟机故障检测和恢复的系统实现,包括如下步骤:
S1、虚拟机故障检测配置模块接收用户指定的虚拟机故障检测配置信息;
S2、虚拟机故障检测管理模块从虚拟机故障检测模块中读取虚拟机故障检测配置信息,并根据虚拟机故障检测配置信息向虚拟机故障检测后端发送检测启动指令;根据检测启动指令启动虚拟机故障检测后端,虚拟机故障检测后端与设置在虚拟机内的虚拟机故障检测前端通过域间共享存储系统传递检测虚拟机的心跳信息;虚拟机故障检测后端根据心跳信息判断虚拟机是否发生故障并将结果发送至虚拟机故障检测管理模块。
一种虚拟机启动的方法,其通过上述虚拟机故障检测和恢复的系统实现,包括如下步骤:
S01、当虚拟机使用者关闭或者重启虚拟机内操作系统时,关机或者重启操作将首先触发该虚拟机对应的虚拟机故障检测前端向域间共享存储系统的相应心跳关键字中写入关机心跳值;
S02、虚拟机故障检测后端从域间共享存储系统中读取关机心跳值,并将关机心跳值传递给虚拟机故障检测管理模块;
S03、虚拟机故障检测管理模块关闭该虚拟机对应的虚拟机故障检测后端后,再执行虚拟机关闭或者重启。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国船舶重工集团公司第七0九研究所,未经中国船舶重工集团公司第七0九研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510416209.0/2.html,转载请声明来源钻瓜专利网。