[发明专利]一种作业调度管理方法和装置在审
申请号: | 201911370441.X | 申请日: | 2019-12-26 |
公开(公告)号: | CN111190713A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 王雄斌 | 申请(专利权)人: | 曙光信息产业(北京)有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F11/07;G06F11/30 |
代理公司: | 北京德恒律治知识产权代理有限公司 11409 | 代理人: | 章社杲;卢军峰 |
地址: | 100193 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 作业 调度 管理 方法 装置 | ||
1.一种作业调度管理方法,其特征在于,包括:
提交作业并将所述作业分配到计算节点上运行;
采集在所述计算节点上发生的硬件故障内容;
根据所述硬件故障内容得到所述计算节点的硬件健康度分数;
当所述计算节点上的所述作业运行退出时,将所述硬件健康度分数反馈给提交所述作业的用户。
2.根据权利要求1所述的作业调度管理方法,其特征在于,根据所述硬件故障内容得到所述计算节点的硬件健康度分数,包括,根据故障类型是否会影响作业运行,得到该节点的硬件健康度分数,其中,影响作业运行的故障类型对应的硬件健康度分数低于不影响作业运行的故障类型对应的硬件健康度分数。
3.根据权利要求2所述的作业调度管理方法,其特征在于,影响作业运行的所述故障类型包括第一故障类型和第二故障类型,其中,所述第一故障类型对应的硬件健康度分数高于所述第二故障类型对应的硬件健康度分数,所述第一故障类型对作业运行的影响程度小于所述第二故障类型对作业运行的影响程度。
4.根据权利要求1所述的作业调度管理方法,其特征在于,采集在所述计算节点上发生的硬件故障内容,包括:从电源、CPU、内存、硬盘、网络、风扇部件进行采集所述硬件故障内容。
5.根据权利要求1所述的作业调度管理方法,其特征在于,将所述硬件健康度分数反馈给提交所述作业的用户,包括,将所述作业运行过程中的最低健康度分数反馈给用户。
6.根据权利要求1所述的作业调度管理方法,其特征在于,还包括:
监测所述计算节点上发生的硬件故障内容;
根据所述监测的结果调整所述分配的调度策略。
7.一种作业调度管理装置,其特征在于,包括:
作业提交及分配模块,用于提交作业并将所述作业分配到计算节点上运行;
硬件故障采集模块,用于采集在所述计算节点上发生的硬件故障内容;
硬件健康度分数获得模块,用于根据所述硬件故障内容得到所述计算节点的硬件健康度分数;
反馈模块,用于当所述计算节点上的所述作业运行退出时,将所述硬件健康度分数反馈给提交所述作业的用户。
8.根据权利要求7所述的作业调度管理装置,其特征在于,所述硬件健康度分数获得模块还用于根据故障类型是否会影响作业运行,得到该节点的硬件健康度分数,其中,影响作业运行的故障类型对应的硬件健康度分数低于不影响作业运行的故障类型对应的硬件健康度分数。
9.根据权利要求8所述的作业调度管理装置,其特征在于,影响作业运行的所述故障类型包括第一故障类型和第二故障类型,其中,所述第一故障类型对应的硬件健康度分数高于所述第二故障类型对应的硬件健康度分数,所述第一故障类型对作业运行的影响程度小于所述第二故障类型对作业运行的影响程度。
10.根据权利要求7所述的作业调度管理装置,其特征在于,所述硬件故障采集模块还用于从电源、CPU、内存、硬盘、网络、风扇部件进行采集所述硬件故障内容。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于曙光信息产业(北京)有限公司,未经曙光信息产业(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911370441.X/1.html,转载请声明来源钻瓜专利网。