[发明专利]一种基于优先级的深度学习任务调度方法及装置有效

专利信息
申请号: 201910866036.0 申请日: 2019-09-12
公开(公告)号: CN110780991B 公开(公告)日: 2023-01-06
发明(设计)人: 左聪越 申请(专利权)人: 苏州浪潮智能科技有限公司
主分类号: G06F9/50 分类号: G06F9/50;G06N20/00
代理公司: 济南诚智商标专利事务所有限公司 37105 代理人: 李修杰
地址: 215100 江苏省苏州市吴*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 优先级 深度 学习 任务 调度 方法 装置
【权利要求书】:

1.一种基于优先级的深度学习任务调度方法,其特征是,包括:

根据用户的优先级确定job的优先级,job优先级高的优先被调度,其中用户优先级与其提交的job优先级对应相同;

如果job的优先级相同,获取job的状态,处于ready状态的job优先被调度;

如果job均处于ready状态,通过调用job的优先级函数计算job的share值并进行比较,share值最小的job优先被调度;其中,所述通过调用job的优先级函数,计算job的share值并进行比较具体包括:

计算集群中所有主机的可分配资源,其公式如下:

其中,表示集群中GPU的可分配资源,表示对集群中所有主机上GPU的可分配资源进行求和计算;表示集群中Memory的可分配资源,表示对集群中所有主机上Memory的可分配资源进行求和计算;表示集群中CPU的可分配资源,表示对集群中所有主机上CPU的可分配资源进行求和计算;

计算每个job中的所有task请求的资源,其公式如下:

其中,表示job中请求的GPU资源,表示job中所有task请求的GPU资源进行求和;表示job中请求的Memory资源,表示job中所有task请求的Memory资源进行求和;表示job中请求的CPU资源,表示job中所有task请求的CPU资源进行求和;

分别计算GPU、Memory、CPU的share值,从中选取最大值作为job的share值,并对job的share值进行比较,其公式如下:

其中,表示GPU 的share值,具体是job中请求的GPU资源和集群中GPU的可分配资源的比值;表示Memory 的share值,具体是job中请求的Memory资源和集群中Memory的可分配资源的比值;表示GPU 的share值,具体是job中请求的CPU资源和集群中CPU的可分配资源的比值。

2.根据权利要求1所述的基于优先级的深度学习任务调度方法,其特征是,还包括:如果job的share值相同,获取job的创建时间,创建时间早的job优先被调度。

3.根据权利要求1所述的基于优先级的深度学习任务调度方法,其特征是,job处于ready状态的判断方法具体是:

通过调用gang插件,统计job内处于allocated状态以及succeeded状态的task的数量之和,当job内处于allocated状态以及succeeded状态的task的数量之和大于等于第一阈值时,即为job处于ready状态。

4.根据权利要求3所述的基于优先级的深度学习任务调度方法,其特征是,所述第一阈值为job的运行最小task数量。

5.根据权利要求1所述的基于优先级的深度学习任务调度方法,其特征是,所述job的优先级函数具体是通过drf函数定义获得。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910866036.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top