[发明专利]基于检查点的作业调度方法和系统无效
申请号: | 201110265364.9 | 申请日: | 2011-09-08 |
公开(公告)号: | CN102289392A | 公开(公告)日: | 2011-12-21 |
发明(设计)人: | 马少杰;戴荣;王璟;许涛;李斌;李程 | 申请(专利权)人: | 曙光信息产业股份有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 北京市德恒律师事务所 11306 | 代理人: | 陆鑫;高雪琴 |
地址: | 300384 天津市西青区华*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 检查点 作业 调度 方法 系统 | ||
技术领域
本发明总体上涉及网络领域,更具体地,涉及基于检查点的作业调度方法和系统。
背景技术
在目前的网络硬件配置中,集群环境下用户作业的运行需要依赖节点计算环境的稳定,而集群环境节点众多,由于误操作、硬件故障等不可抗力因素导致作业停止,为用户带来损失。运用检查点技术,可以在固定时间对用户作业进行保护,在作业停止时可以迅速恢复作业的运行,减少损失,提高作业的运行效率。
很多软件自身也有类似的功能,但是缺乏通用性。并且这样的软件收费昂贵,用户难以接受。
发明内容
为解决上述问题,本发明提供了一种基于检查点的作业调度方法,包括以下步骤:用户作业进入队列进行等待,当获取资源时,用户作业进入内存区域运行;按照预先设置的迁移参数,将用户作业按时间点进行保存,并将时间点设置为检查点;当用户作业异常中断时,进行用户作业的再次提交,用户作业进入队列进行等待,当获取资源时,用户作业运行,读取与检查点对应的用户作业的信息,并继续执行用户作业。
其中,当用户作业没有异常中断时,用户作业完成。
其中,当用户作业的提交发生错误时,退出用户作业。
其中,在用户作业进入队列进行等待的步骤之前,提交用户作业,并在用户作业开始时设置作业参数和迁移参数。
此外,本发明还提供了一种基于检查点的作业调度系统,包括:等待模块,用于使用户作业进入队列进行等待,当获取资源时,用户作业进入内存区域运行;检查点保存模块,用于按照预先设置的迁移参数,将用户作业按时间点进行保存,并将时间点设置为检查点;其中,用户作业异常中断时,进行用户作业的再次提交,用户作业进入队列进行等待,当获取资源时,用户作业运行,读取与检查点对应的用户作业的信息,并继续执行用户作业。
该系统还包括:退出模块,用于在用户作业的提交发生错误时,退出用户作业。
该系统还包括:提交模块,用于提交用户作业;以及参数设置模块,用于在用户作业开始时设置作业参数和迁移参数。
我们提出的检查点与作业调度系统的结合技术可以使得停止的作业自动重新运行,利用作业队列的特性,在作业是失效的情况下自动重新提交恢复作业,自动完成作业的再次运行,并且具有广泛的用途,适用于大部分的软件系统。
附图说明
当结合附图进行阅读时,根据下面详细的描述可以更好地理解本发明。应该强调的是,根据工业中的标准实践,各种部件没有被按比例绘制。实际上,为了清楚的讨论,各种部件的尺寸可以被任意增加或减少
图1示出了根据本发明的示例性实施例的基于检查点的作业调度方法的流程图。
具体实施方式
为了实施本发明的不同部件,以下描述提供了许多不同的实施例或示例。以下描述元件和布置的特定示例以简化本发明。当然这些仅仅是示例并不打算限定。再者,以下描述中第一部件形成在第二部件上可包括其中第一和第二部件以直接接触形成的实施例,并且也可包括其中额外的部件形成插入到第一和第二部件中的实施例,使得第一和第二部件不直接接触。为了简明和清楚,可以任意地以不同的尺寸绘制各种部件。
本发明大体的技术方案思路如下:
1.利用Checkpoing/Restart技术,对特定时间的进程进行保护,将保存文件存储到硬件存储空间上,当用户进程由于异常中断导致停止运行时,可以迅速从存储空间的检查点文件中将进程进行恢复。
2.利用作业调度系统,将作业的再次提交,保证用户作业不间断执行。
图1示出了根据本发明的示例性实施例的基于检查点的作业调度方法的流程图。如图1所示,本发明提供了一种基于检查点的作业调度方法,包括以下步骤:S101,提交用户作业,并在用户作业开始时设置作业参数和迁移参数;S103,用户作业进入队列进行等待,当获取资源时,用户作业进入内存区域运行;S105,按照预先设置的迁移参数,将用户作业按时间点进行保存,并将时间点设置为检查点;当用户作业异常中断时,停机检查故障问题,其中,当故障排除时,通过读取检查点所对应的用户作业信息来重新恢复用户作业。
优选地,当用户作业没有异常中断时,用户作业完成。
优选地,当用户作业的提交发生错误时,退出用户作业。
优选地,在用户作业进入队列进行等待的步骤之前,提交用户作业,并在用户作业开始时设置作业参数和迁移参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业股份有限公司,未经曙光信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110265364.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高效污水COD处理方法
- 下一篇:一种智能河道污水处理系统及方法