[发明专利]一种基于作业调度系统的应用作业控制系统及其控制方法有效
申请号: | 201210333454.1 | 申请日: | 2012-09-10 |
公开(公告)号: | CN102880506A | 公开(公告)日: | 2013-01-16 |
发明(设计)人: | 张磊;张涛 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F9/46 | 分类号: | G06F9/46 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100193 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于作业调度系统的应用作业控制系统及其控制方法,控制系统包括组播消息发送器、应用程序监控器和作业调度系统;当组播消息发送器被应用程序作业调用后,向组播域发送组播消息;应用程序监控器中的应用监听器接收所述组播消息并将其发送到应用程序监控器中的消息分析器中;消息分析器判定所述组播消息运行状态是否正常,若处于异常状态,则通过所述作业调度系统将该应用程序作业Rerun;该方法解决了现有调度系统仅从作业的角度为使用者提供作业的相应状态信息,而没有针对应用本身的运行状态进行监控和管理的问题,保证高性能计算集群上作业内的应用程序的正常运行,避免了资源的浪费,同时还保证了应用程序作业运行的准确性。 | ||
搜索关键词: | 一种 基于 作业 调度 系统 应用 控制系统 及其 控制 方法 | ||
【主权项】:
一种基于作业调度系统的应用作业控制系统,其特征在于,所述控制系统包括组播消息发送器、应用程序监控器和作业调度系统;所述组播消息发送器被应用程序作业调用后,向组播域发送组播消息;所述应用程序监控器中的应用监听器接收所述组播消息并将其发送到应用程序监控器中的消息分析器中;所述消息分析器判定所述组播消息运行状态是否正常,若处于异常状态,则通过所述作业调度系统将该应用程序作业Rerun;当应用程序监控器中的应用监听器在>10ms的指定时间内没有收到应用作业的组播消息,则认为应用作业处于异常状态,则通过所述作业调度系统将该应用程序作业Rerun。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210333454.1/,转载请声明来源钻瓜专利网。