[发明专利]一种基于优先级的深度学习任务调度方法及装置有效
申请号: | 201910866036.0 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110780991B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 左聪越 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 优先级 深度 学习 任务 调度 方法 装置 | ||
1.一种基于优先级的深度学习任务调度方法,其特征是,包括:
根据用户的优先级确定job的优先级,job优先级高的优先被调度,其中用户优先级与其提交的job优先级对应相同;
如果job的优先级相同,获取job的状态,处于ready状态的job优先被调度;
如果job均处于ready状态,通过调用job的优先级函数计算job的share值并进行比较,share值最小的job优先被调度;其中,所述通过调用job的优先级函数,计算job的share值并进行比较具体包括:
计算集群中所有主机的可分配资源,其公式如下:
其中,表示集群中GPU的可分配资源,表示对集群中所有主机上GPU的可分配资源进行求和计算;表示集群中Memory的可分配资源,表示对集群中所有主机上Memory的可分配资源进行求和计算;表示集群中CPU的可分配资源,表示对集群中所有主机上CPU的可分配资源进行求和计算;
计算每个job中的所有task请求的资源,其公式如下:
其中,表示job中请求的GPU资源,表示job中所有task请求的GPU资源进行求和;表示job中请求的Memory资源,表示job中所有task请求的Memory资源进行求和;表示job中请求的CPU资源,表示job中所有task请求的CPU资源进行求和;
分别计算GPU、Memory、CPU的share值,从中选取最大值作为job的share值,并对job的share值进行比较,其公式如下:
其中,表示GPU 的share值,具体是job中请求的GPU资源和集群中GPU的可分配资源的比值;表示Memory 的share值,具体是job中请求的Memory资源和集群中Memory的可分配资源的比值;表示GPU 的share值,具体是job中请求的CPU资源和集群中CPU的可分配资源的比值。
2.根据权利要求1所述的基于优先级的深度学习任务调度方法,其特征是,还包括:如果job的share值相同,获取job的创建时间,创建时间早的job优先被调度。
3.根据权利要求1所述的基于优先级的深度学习任务调度方法,其特征是,job处于ready状态的判断方法具体是:
通过调用gang插件,统计job内处于allocated状态以及succeeded状态的task的数量之和,当job内处于allocated状态以及succeeded状态的task的数量之和大于等于第一阈值时,即为job处于ready状态。
4.根据权利要求3所述的基于优先级的深度学习任务调度方法,其特征是,所述第一阈值为job的运行最小task数量。
5.根据权利要求1所述的基于优先级的深度学习任务调度方法,其特征是,所述job的优先级函数具体是通过drf函数定义获得。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910866036.0/1.html,转载请声明来源钻瓜专利网。