[发明专利]一种非对称结构的软件三机热备容错方法无效
申请号: | 200910238456.0 | 申请日: | 2009-11-26 |
公开(公告)号: | CN101876926A | 公开(公告)日: | 2010-11-03 |
发明(设计)人: | 张炯;龙翔;胡彦彦;高小鹏;白跃斌 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06F11/14 | 分类号: | G06F11/14;G06F9/455 |
代理公司: | 北京永创新实专利事务所 11121 | 代理人: | 李有浩 |
地址: | 100083*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 对称 结构 软件 三机热备 容错 方法 | ||
1.一种非对称结构的软件三机热备容错方法,其特征在于,首先在本地和远程物理主机之上都装载虚拟机系统,再实施以下步骤:
步骤1:系统初始化;本地物理主机启动,划分处理器核,创建工作域以及本地备份域,并设定周期性备份时钟,远程物理主机启动,与本地物理主机建立连接,并创建远程备份域;
步骤2:本地备份;当备份时钟到来,本地物理主机上的本地状态同步模块暂停本地工作域的运行,执行本地状态同步操作,将工作域的状态同步到本地备份域中,具体操作包括虚拟处理器状态同步、虚拟内存数据同步、虚拟设备状态同步以及虚拟文件系统状态同步;
步骤3:远程备份;待本地状态同步完成,本地状态同步模块先恢复本地工作域至正常运行状态,随后发出指令至本地物理主机之上的第一远程状态同步模块,由第一远程状态同步模块开始执行远程状态同步操作,将本地备份域的状态同步到远程备份域中,具体操作包括虚拟处理器状态同步、虚拟内存数据同步、虚拟设备状态同步以及虚拟文件系统状态同步;
步骤4:工作域状态监控与故障恢复;本步骤包含:
步骤4.1工作域状态监控;本地物理主机之上的第一健康监控与故障恢复模块监控工作域的运行状态,工作域处于正常工作状态时,本地和远程备份域处于暂停状态,即不参与调度运行,也不进行I/O操作;如有故障发生,执行步骤4.2;
步骤4.2工作域故障恢复;首先尝试激活本地备份域,并恢复工作域到正常状态;如果本地恢复操作失败,则通过网络连接位于远程物理主机之上的第二健康监控与故障恢复模块,尝试激活远程备份域,并恢复工作域到正常运行状态;
步骤5:远程物理主机状态监控与故障恢复;本步骤包含:
步骤5.1远程物理主机状态监控;本地物理主机之上的第一健康监控与故障恢复模块监控远程物理主机的运行状态,该模块中设置周期性时钟,时钟到期后,该模块尝试与位于远程物理主机之上的第二健康监控与故障恢复模块通信,判断远程主机当前状态是否正常,如果通信并读取成功,表明状态正常,重置定时器,返回正常执行状态,如果通信失败,表明有故障发生,执行步骤5.2;
步骤5.2远程物理主机故障恢复;首先重启远程物理主机,然后让其与本地物理主机建立连接,随后立即执行一次远程同步操作,恢复其到正常备份状态;
步骤6:本地物理主机状态监控与故障恢复;本步骤包含:
步骤6.1本地物理主机状态监控;远程物理主机之上的第二健康监控及故障恢复模块监控本地物理主机的运行状态,该模块中设置周期性时钟,时钟到期后,该模块尝试与位于本地物理主机之上的第一健康监控与故障恢复模块通信,判断本地物理主机当前状态是否正常,如果通信并读取成功,表明状态正常,重置定时器,返回正常执行状态;如果通信失败,表明有故障发生,执行步骤6.2;
步骤6.2本地物理主机故障恢复,首先立即激活远程物理主机之上的远程备份域,接替本地物理主机之上工作域的现有工作,之后重启本地物理主机并重新执行初始化过程,随后与远程物理主机建立连接;连接建立后,第一远程状态同步模块与远程物理主机之上的第二远程状态同步模块配合,在本地物理主机之上重新构建工作域,并迭代执行状态同步操作,将远程备份域的当前状态不断增量同步到本地物理主机之上的工作域中,当迭代数量达到预设值后,暂停远程备份域的工作,执行最后一次同步操作,然后重新激活工作域,立即创建本地备份域,并执行一次本地和远程同步操作。
2.根据权利要求1所述的一种非对称结构的软件三机热备容错方法,其特征在于,所述步骤1中本地物理主机启动,划分处理器核具体为:本地物理主机在启动时,位于本地物理主机上的调度管理模块首先会选择系统中最后一颗能用的处理器核作为远程同步专用处理器集,该处理器核并不进入能用处理器队列,而是不断执行第一远程状态同步模块,该模块会不断的检测是否有来自本地状态同步模块的指令,如果有,则执行本地备份域和远程备份域的同步操作;而本地物理主机的其它处理器核都被调度管理模块归为通用处理器集,执行传统的计算任务。
3.根据权利要求1所述的一种非对称结构的软件三机热备容错方法,其特征在于,所述步骤3具体为:本地状态同步模块完成本地备份操作后,恢复本地物理主机之上工作域的运行,并利用信号的方式通知第一远程状态同步模块,告知其已经能够开始执行远程备份操作;若当前没有远程备份操作需要执行,则第一远程状态同步模块进入自旋等待状态,直到本地状态同步模块发送信号将其唤醒;远程备份操作执行时,本地备份域的状态被通过网络同步到远程备份域中,该过程由第一远程状态同步模块和远程物理主机之上的第二远程状态同步模块配合完成,首先由第一远程状态同步模块向第二远程状态同步模块发起请求,第二远程状态同步模块检查远程物理主机的运行状态以及资源使用情况,若能用内存数量及文件系统空闲空间能够满足本次备份操作的需要,则接受第一远程状态同步模块的备份请求,并发出应答信号,然后第一远程状态同步模块开始发送需要同步的数据,第二远程状态同步模块接受到同步数据后,将其写入远程备份域的指定位置,包括虚拟处理器信息、虚拟内存数据、虚拟设备状态信息,以及虚拟文件系统数据;当本次备份操作完成后,第一远程状态同步模块检查是否有新的备份操作需要执行,如果有,则开始下一轮数据传递,否则进入睡眠状态,等待下一次本地状态同步模块将其唤醒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910238456.0/1.html,转载请声明来源钻瓜专利网。