[发明专利]任务迁移系统无效
申请号: | 201010554103.4 | 申请日: | 2010-11-19 |
公开(公告)号: | CN102012843A | 公开(公告)日: | 2011-04-13 |
发明(设计)人: | 秦东明;曹振南;吴宏文;马少杰;陈伟 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48 |
代理公司: | 北京市德恒律师事务所 11306 | 代理人: | 陆鑫;熊须远 |
地址: | 100084 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 任务 迁移 系统 | ||
技术领域
本发明涉及气象处理领域,尤其涉及一种任务迁移系统。
背景技术
数值天气预报水平的高低目前已经成为了衡量世界各国气象事业现代化程度的重要标志,而气象预报也已经从传统的建立在天气气候定性理论、数值统计与预报员经验基础上的半经验半理论的定性方法,发展到了以大气科学理论为基础,综合运用科技最新成就,在高性能计算机平台上完成的现代气象数值预报。因此,进一步研发中国的气象数值预报创新技术,是提高我国气象预测水平、使之满足国家多方面对气象服务需求的最根本的科学途径。
目前,气象业务处理系统通常采用并行处理。并行任务的完成通常需要多个计算节点协作完成,在任务量比较大的情况下,并行任务的完成通常需要较多的时间,大多数的并行任务如果出现异常被中断,那么只能从头开始运行,这对计算资源和时间有要求的任务是重要影响。
部分并行任务采用修改自身结构,利用定时保存运行结果,以实现从保存处重新启动任务。这种情况通常工作量较大,而且需要针对每个任务修改其结构,不具备通用性。
目前运行业务系统并行任务过程中如果某个计算节点出现问题而导致业务被中断那么业务必须重新从头开始运行,在任务运行时间较长情况下极其损耗资源,无法保证业务系统顺利完成,需要实现一种通用的可中途启动作业的系统。
如果业务系统被中断,需要人工手动重新修改运行参数来启动业务运行;在实际业务系统要求每天定时运行情况下维护成本太大。
发明内容
针对相关技术中存在的一个或多个问题,本发明的目的在于提供一种,以解决上述问题中的至少之一。
为实现上述目的,根据本发明的一个方面,提供了一种任务迁移系统,该系统包括:参数设置模块,用于设置任务迁移参数;任务提交和运行模块,用于提交并行任务并且运行并行任务;作业状态检测模块,用于检测任务运行状态,并将任务运行状态通知给任务迁移模块;以及任务迁移模块,用于在故障检测模块检测到故障的情况下,根据所设置的任务迁移参数调度出现异常中断的并行任务并使其继续运行。
优选地,任务迁移参数包括断点信息。
优选地,任务迁移模块包括:迁移模块,用于根据与出现异常中断的并行任务最近的断点的断点信息调度出现异常中断的并行任务;以及作业重启模块,用于将断点信息通知给任务提交和运行模块,并指示任务提交和运行模块从断点重启出现异常中断的并行任务。
优选地,断点信息包括:断点间隔和保存位置。
优选地,该任务迁移系统用于气象业务处理。
为实现上述目的,根据本发明的另一个方面,提供了一种任务迁移方法,该方法包括:通过参数设置模块设置任务迁移参数;通过任务提交和运行模块提交并行任务并且运行并行任务;在运行并行任务期间,通过作业状态检测模块检测任务运行状态;以及在故障检测模块检测到故障的情况下,根据所设置的任务迁移参数通过任务迁移模块调度出现异常中断的并行任务并使其继续运行。
优选地,任务迁移参数包括断点信息。
优选地,任务迁移的处理包括:根据与出现异常中断的并行任务最近的断点的断点信息,通过任务迁移模块调度出现异常中断的并行任务;以及根据断点信息通过任务提交和运行模块从断点重启出现异常中断的并行任务。
优选地,断点信息包括:断点间隔和保存位置。
优选地,该任务迁移方法用于气象业务处理。
本发明通过利用断点/重启功能,实现了在任务由于异常被中断后利用保存的断点信息重新启动并行任务运行,并且实现了并行任务重启后无需手工干预运行。
附图说明
图1是根据本发明的实施例的任务迁移系统的框图;
图2是根据本发明的实施例的任务迁移模块的框图;
图3是根据本发明的实施例的任务迁移方法的流程图;以及
图4是根据本发明的实施例的上述任务迁移的处理的流程图。
具体实施方式
图1是根据本发明的实施例的任务迁移系统的框图。如图1所示,根据本发明的实施例的任务迁移系统包括:参数设置模块102,用于设置任务迁移参数;任务提交和运行模块104,用于提交并行任务并且运行并行任务;作业状态检测模块106,用于检测任务运行状态,并将任务运行状态通知给任务迁移模块;以及任务迁移模块108,用于在故障检测模块检测到故障的情况下,根据所设置的任务迁移参数调度出现异常中断的并行任务并使其继续运行。其中,任务迁移参数包括断点信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010554103.4/2.html,转载请声明来源钻瓜专利网。