[发明专利]一种基于优先级的深度学习任务调度方法及装置有效
申请号: | 201910866036.0 | 申请日: | 2019-09-12 |
公开(公告)号: | CN110780991B | 公开(公告)日: | 2023-01-06 |
发明(设计)人: | 左聪越 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N20/00 |
代理公司: | 济南诚智商标专利事务所有限公司 37105 | 代理人: | 李修杰 |
地址: | 215100 江苏省苏州市吴*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 优先级 深度 学习 任务 调度 方法 装置 | ||
本发明为了解决现有技术中存在的问题,创新提出了一种基于优先级的深度学习任务调度方法,包括:根据用户的优先级确定job的优先级,job优先级高的优先被调度,其中用户优先级与其提交的job优先级对应相同;如果job的优先级相同,获取job的状态,处于ready状态的job优先被调度;如果job均处于ready状态,通过调用job的优先级函数计算job的share值并进行比较,share值最小的job优先被调度,本发明还提出了一种基于优先级的深度学习任务调度装置,通过对深度学习训练任务根据优先级进行排队,使高优先级的任务优先运行,合理利用计算资源,提高了深度学习训练任务的效率。
技术领域
本发明涉及深度学习任务调度领域,尤其是涉及一种基于优先级的深度学习任务调度方法及装置。
背景技术
深度学习是机器学习的一种,而机器学习是实现人工智能的必经路径。深度学习的概念源于人工神经网络的研究,含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更加抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。研究深度学习的动机在于建立模拟人脑进行分析学习的神经网络,它模仿人脑的机制来解释数据,例如图像,声音和文本等。
而在深度学习领域,调度算法是深度学习系统的核心,对于深度学习任务是否可以快速高效完成,以及计算资源的是否合理利用起着决定性因素。
目前深度学习调度中,并没有统一的调度方法,调度比较混乱,缺乏根据任务优先级来确定统一的资源调度,计算资源的利用不够合理,深度学习训练任务效率较低。
发明内容
本发明为了解决现有技术中存在的问题,创新提出了一种基于优先级的深度学习任务调度方法及装置,有效解决由于缺乏根据任务优先级来确定统一的资源调度造成计算资源的利用不够合理的问题,有效的提高的深度学习训练任务效率。
本发明第一方面提供了一种基于优先级的深度学习任务调度方法,包括:
根据用户的优先级确定job的优先级,job优先级高的优先被调度,其中用户优先级与其提交的job优先级对应相同;
如果job的优先级相同,获取job的状态,处于ready状态的job优先被调度;
如果job均处于ready状态,通过调用job的优先级函数计算job的share值并进行比较,share值最小的job优先被调度。
结合第一方面,在第一方面第一种可能的实现方式中,还包括:如果job的share值相同,获取job的创建时间,创建时间早的job优先被调度。
结合第一方面,在第一方面第二种可能的实现方式中,job处于ready状态的判断方法具体是:
通过调用gang插件,统计job内处于allocated状态以及succeeded状态的task的数量之和,当job内处于allocated状态以及succeeded状态的task的数量之和大于等于第一阈值时,即为job处于ready状态。
进一步地,所述第一阈值为job的运行最小task数量。
结合第一方面,在第一方面第三种可能的实现方式中,所述通过调用job的优先级函数,计算job的share值并进行比较具体包括:
计算集群中所有主机的可分配资源,其公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910866036.0/2.html,转载请声明来源钻瓜专利网。