[发明专利]一种计算任务调度方法、装置、电子设备及可读存储介质有效
申请号: | 202210413206.1 | 申请日: | 2022-04-20 |
公开(公告)号: | CN114510339B | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 贾兆荣 | 申请(专利权)人: | 苏州浪潮智能科技有限公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 张艺 |
地址: | 215100 江苏省苏州*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 任务 调度 方法 装置 电子设备 可读 存储 介质 | ||
本申请公开了一种计算任务调度方法、装置、电子设备及计算机可读存储介质,应用于神经网络领域;该方法包括:获取网络描述数据;基于网络描述数据,确定各个网络层任务之间的依赖关系;检测人工智能加速计算部件上的空闲寄存器组;基于依赖关系、网络描述数据和空闲寄存器组类型,生成目标寄存器配置,并将目标寄存器配置写入到空闲寄存器组;若检测到目标网络层任务完成通知,则基于依赖关系确定目标网络层任务完成通知对应的目标网络层任务的下一任务,并将下一任务在人工智能加速计算部件上对应的第一功能模块启动,以便执行下一任务;该方法能够提高人工智能加速计算部件的计算效率。
技术领域
本申请涉及神经网络技术领域,特别涉及一种计算任务调度方法、计算任务调度装置、电子设备及计算机可读存储介质。
背景技术
人工智能加速引擎(AI Engine)是专门为深度学习算法设计的加速计算部件,深度学习算法常用的卷积神经网络结构(Convolutional Neural Networks,CNN)通常包含多个卷积组合层,每个卷积组合层又包括卷积、激活、池化等小层。卷积组合层用于提取图像中的不同的特征,一个CNN通常包含数十甚至上百个卷积组合层。当AI engine的硬件结构定型后,其理论算力是固定不变的。但在实际应用中,由于配置时间、数据传输时间、模块间的不协调导致的延时等开销,导致AI engine的计算效率较低。
因此,相关技术存在的AI engine的计算效率较低的问题,是本领域技术人员需要解决的技术问题。
发明内容
有鉴于此,本申请的目的在于提供一种计算任务调度方法、计算任务调度装置、电子设备及计算机可读存储介质,提高计算效率。
为解决上述技术问题,本申请提供了一种计算任务调度方法,应用于任务调度器,所述方法包括:
获取网络描述数据;所述网络描述数据用于描述目标神经网络中各个网络层分别对应的网络层任务;
基于所述网络描述数据,确定各个所述网络层任务之间的依赖关系;
检测人工智能加速计算部件上的空闲寄存器组;所述人工智能加速计算部件上各个功能模块分别对应于至少两个寄存器组;
基于所述依赖关系、所述网络描述数据和空闲寄存器组类型,生成目标寄存器配置,并将所述目标寄存器配置写入到所述空闲寄存器组;
若检测到目标网络层任务完成通知,则基于所述依赖关系确定所述目标网络层任务完成通知对应的目标网络层任务的下一任务,并将所述下一任务在所述人工智能加速计算部件上对应的第一功能模块启动,以便执行所述下一任务。
可选地,所述网络描述数据的生成过程,包括:
确定所述人工智能加速计算部件的硬件架构;
基于所述硬件架构,生成对应的硬件架构描述数据;
获取所述目标神经网络,并基于所述目标神经网络和所述硬件架构描述数据,生成所述网络描述数据。
可选地,所述基于所述目标神经网络和所述硬件架构描述数据,生成所述网络描述数据,包括:
对所述目标神经网络进行模型解析,得到中间图;
基于所述硬件架构描述数据,对所述中间图进行图优化处理,得到优化图;
对所述优化图进行编译处理,得到所述网络描述数据。
可选地,所述基于所述目标神经网络和所述硬件架构描述数据,生成所述网络描述数据,包括:
确定所述目标神经网络中的各个网络层,以及所述网络层之间的所述依赖关系;
获取各个网络层分别对应的预设网络层描述数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州浪潮智能科技有限公司,未经苏州浪潮智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210413206.1/2.html,转载请声明来源钻瓜专利网。