[发明专利]基于检查点的故障排除方法和装置无效
申请号: | 201110265365.3 | 申请日: | 2011-09-08 |
公开(公告)号: | CN102263671A | 公开(公告)日: | 2011-11-30 |
发明(设计)人: | 戴荣;马少杰;王璟;许涛;李斌;李程 | 申请(专利权)人: | 曙光信息产业股份有限公司 |
主分类号: | H04L12/24 | 分类号: | H04L12/24 |
代理公司: | 北京市德恒律师事务所 11306 | 代理人: | 陆鑫;高雪琴 |
地址: | 300384 天津市西青区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 检查点 故障 排除 方法 装置 | ||
1.一种基于检查点的故障排除方法,其特征在于,包括以下步骤:
按照预先设置的迁移参数,将用户作业按时间点进行保存,并将所述时间点设置为检查点;
当所述用户作业异常中断时,停机检查故障问题,其中,
当故障排除时,通过读取所述检查点所对应的用户作业信息来重新恢复所述用户作业。
2.根据权利要求1所述的方法,其特征在于,当所述用户作业没有异常中断时,所述用户作业完成。
3.根据权利要求1或2所述的方法,其特征在于,当故障无法排除时,退出所述用户作业并迁移至其他节点继续运行。
4.根据权利要求1所述的方法,其特征在于,在将用户作业按时间点进行保存的步骤之前,提交所述用户作业,并在所述用户作业开始时设置作业参数和所述迁移参数。
5.一种基于检查点的故障排除装置,其特征在于,包括:
检查点保存模块,用于按照预先设置的迁移参数,将用户作业按时间点进行保存,并将所述时间点设置为检查点;
停机模块,用于在所述用户作业异常中断时,停机检查故障间题,
其中,还包括恢复模块,用于在故障排除时,通过读取所述检查点所对应的用户作业信息来重新恢复所述用户作业。
6.根据权利要求5所述的装置,其特征在于,还包括:迁移模块,用于在故障无法排除时,退出所述用户作业并迁移至其他节点继续运行。
7.根据权利要求5所述的装置,其特征在于,还包括:
提交模块,用于提交所述用户作业;以及
参数设置模块,用于在所述用户作业开始时设置作业参数和所述迁移参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业股份有限公司,未经曙光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110265365.3/1.html,转载请声明来源钻瓜专利网。