[发明专利]计算图调度方法、装置、电子设备及可读存储介质在审
申请号: | 202210277391.6 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114595068A | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 高开;王丽;曹芳;郭振华;赵雅倩;李仁刚 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06N3/02 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张艺 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 调度 方法 装置 电子设备 可读 存储 介质 | ||
本申请公开了一种计算图调度方法、装置、设备及介质,该方法包括:获取目标计算图;基于算子节点间的依赖关系,对第一节点集合进行划分处理,得到多个计算层组;分别生成各个第二节点集合对应的第一时长,并利用第一时长生成各个计算层组对应的第二时长;若第二最小时长小于第一节点集合对应的第三时长,则将目标计算层组中的第二节点集合确定为新的第一节点集合;若第二最小时长不小于第三时长,则判断其他节点集合是否生成了新的第一节点集合;若没有任一其他节点集合生成了新的第一节点集合,则利用第一节点集合和其他节点集合构成目标计算图的调度结果;该方法保持计算效率相对较高,同时避免了对计算资源的竞争,使得资源利用率平衡。
技术领域
本申请涉及计算机技术领域,特别涉及一种计算图调度方法、计算图调度装置、电子设备及计算机可读存储介质。
背景技术
随着深度学习的发展,神经网络模型越来越复杂,计算量越来越大,如何更加高效的执行整个计算图的重要性不断提高。同时深度学习的硬件设备种类也越来越多,提供了大量的计算资源。深度学习在不同场景下对数据处理的实时性都具有很高的要求,如何设置整个计算图中的算子节点的执行顺序对性能有着至关重要的影响。通常情况下,计算图的调度方式包括顺序调度和贪心调度,顺序调度按照算子的依赖关系每次只调度一个算子,贪心调度会尽可能多地调度满足调度条件的算子。顺序调度会使得整体资源利用率较低,而贪心调度会造成严重的资源竞争,因此相关技术存在无法合理使用计算资源的问题。
因此,相关技术存在的无法合理使用计算资源的问题,是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本申请的目的在于提供一种计算图调度方法、计算图调度装置、电子设备及计算机可读存储介质,能够合理使用计算资源。
为解决上述技术问题,本申请提供了一种计算图调度方法,包括:
获取目标计算图;所述目标计算图包括多个算子节点;
基于所述算子节点间的依赖关系,对第一节点集合进行划分处理,得到多个计算层组;其中,每个所述计算层组包括至少两个第二节点集合,所述第一节点集合为所述目标计算图,或者为对所述目标计算图划分得到的节点集合;
分别生成各个所述第二节点集合对应的第一时长,并利用所述第一时长生成各个所述计算层组对应的第二时长;
若所述第二最小时长小于所述第一节点集合对应的第三时长,则将目标计算层组中的第二节点集合确定为新的第一节点集合;所述第二最小时长为所述第二时长中的最小值,所述目标计算层组为所述第二最小时长对应的计算层组;
若所述第二最小时长不小于所述第三时长,则判断其他节点集合是否生成了新的第一节点集合;
若没有任一其他节点集合生成了新的第一节点集合,则利用所述第一节点集合和所述其他节点集合构成所述目标计算图的调度结果。
可选地,所述分别生成各个所述第二节点集合对应的第一时长,包括:
确定所述第二节点集合中各个算子节点对应的计算设备;
获取所述计算设备对应的算力数据,并利用所述算力数据生成所述算子节点对应的第四时长;
利用所述第四时长得到所述第一时长。
可选地,所述基于所述算子节点间的依赖关系,对第一节点集合进行划分处理,得到多个计算层组,包括:
按照所述依赖关系,将所述第一节点集合进行基于依赖关系连续的算子节点划分处理,得到多个初始计算层组;
确定各个所述初始计算层组中各个算子节点对应的候选计算设备;
将所述候选计算设备依次确定为所述算子节点的计算设备,得到所述计算层组。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210277391.6/2.html,转载请声明来源钻瓜专利网。