[发明专利]一种基于优先级的深度学习任务调度方法及装置有效

申请号：	201910866036.0	申请日：	2019-09-12
公开（公告）号：	CN110780991B	公开（公告）日：	2023-01-06
发明（设计）人：	左聪越	申请（专利权）人：	苏州浪潮智能科技有限公司
主分类号：	G06F9/50	分类号：	G06F9/50;G06N20/00
代理公司：	济南诚智商标专利事务所有限公司 37105	代理人：	李修杰
地址：	215100 江苏省苏州市吴***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于优先级深度学习任务调度方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于优先级的深度学习任务调度方法，其特征是，包括：

根据用户的优先级确定job的优先级，job优先级高的优先被调度，其中用户优先级与其提交的job优先级对应相同；

如果job的优先级相同，获取job的状态，处于ready状态的job优先被调度；

如果job均处于ready状态，通过调用job的优先级函数计算job的share值并进行比较，share值最小的job优先被调度；其中，所述通过调用job的优先级函数，计算job的share值并进行比较具体包括：

计算集群中所有主机的可分配资源，其公式如下：

其中，表示集群中GPU的可分配资源，表示对集群中所有主机上GPU的可分配资源进行求和计算；表示集群中Memory的可分配资源，表示对集群中所有主机上Memory的可分配资源进行求和计算；表示集群中CPU的可分配资源，表示对集群中所有主机上CPU的可分配资源进行求和计算；

计算每个job中的所有task请求的资源，其公式如下：

其中，表示job中请求的GPU资源，表示job中所有task请求的GPU资源进行求和；表示job中请求的Memory资源，表示job中所有task请求的Memory资源进行求和；表示job中请求的CPU资源，表示job中所有task请求的CPU资源进行求和；

分别计算GPU、Memory、CPU的share值，从中选取最大值作为job的share值，并对job的share值进行比较，其公式如下：

其中，表示GPU 的share值，具体是job中请求的GPU资源和集群中GPU的可分配资源的比值；表示Memory 的share值，具体是job中请求的Memory资源和集群中Memory的可分配资源的比值；表示GPU 的share值，具体是job中请求的CPU资源和集群中CPU的可分配资源的比值。

2.根据权利要求1所述的基于优先级的深度学习任务调度方法，其特征是，还包括：如果job的share值相同，获取job的创建时间，创建时间早的job优先被调度。

3.根据权利要求1所述的基于优先级的深度学习任务调度方法，其特征是，job处于ready状态的判断方法具体是：

通过调用gang插件，统计job内处于allocated状态以及succeeded状态的task的数量之和，当job内处于allocated状态以及succeeded状态的task的数量之和大于等于第一阈值时，即为job处于ready状态。

4.根据权利要求3所述的基于优先级的深度学习任务调度方法，其特征是，所述第一阈值为job的运行最小task数量。

5.根据权利要求1所述的基于优先级的深度学习任务调度方法，其特征是，所述job的优先级函数具体是通过drf函数定义获得。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司，未经苏州浪潮智能科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910866036.0/1.html，转载请声明来源钻瓜专利网。