[发明专利]一种基于搜索的深度学习模型部署方法及装置有效

专利信息
申请号: 202310557259.5 申请日: 2023-05-17
公开(公告)号: CN116306856B 公开(公告)日: 2023-09-05
发明(设计)人: 王鹏程;李勇;陈自强;吕波;程稳;曾令仿;陈光;胡陈枢 申请(专利权)人: 之江实验室
主分类号: G06N3/065 分类号: G06N3/065;G06F8/41
代理公司: 北京博思佳知识产权代理有限公司 11415 代理人: 邓超
地址: 311121 浙江省杭*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 搜索 深度 学习 模型 部署 方法 装置
【说明书】:

本说明书公开了一种基于搜索的深度学习模型部署方法及装置,可以获取深度学习模型所对应的计算图,确定计算图中包括的算子,并确定每个算子匹配的硬件资源,而后,根据各算子匹配的硬件资源,构建搜索空间,从搜索空间中选取出目标样本,并确定目标样本对应的运行时长,以及确定目标样本对应的邻域样本,并确定邻域样本对应的运行时长,若邻域样本对应的运行时长短于目标样本的运行时长,将邻域样本作为重新确定出的目标样本,并继续确定目标样本对应的邻域样本以及对应的运行时长,直到满足预设迭代终止条件为止,按照目标样本所对应的分配方案,对深度学习模型的算子进行硬件资源的分配,以进行部署,本方法可以提高深度学习模型的计算效率。

技术领域

本说明书涉及深度学习、编译技术、高性能计算交叉技术领域,尤其涉及一种基于搜索的深度学习模型部署方法及装置。

背景技术

近年来,深度学习技术已经广泛应用于机器视觉、自然语言处理、自动驾驶等多个领域并取得了显著效果。随着深度学习模型结构越来越复杂,参数量越来越大,如何保证模型的性能成了一个关键问题。

在实际应用中,可以采用更高性能的硬件来运行深度学习模型,目前,市场上存在神经网络专用的加速芯片。当然,还可以采用深度学习编译器,来对深度学习模型进行构建以及优化,采用深度学习编译器的方式,可由中央处理器(graphics processing unit,cpu)、显卡(graphics processing unit,gpu)等来运行深度学习模型。

在实际的部署场景中可以将深度学习模型部署在多个硬件上,如,同时部署在cpu、gpu和多种神经网络加速芯片上,但是,当前将深度学习模型部署在多个硬件上的方式,可以是依据人为经验,将深度学习模型指定的部分分配给指定的某些硬件进行运行,从而不一定能够发挥最高的性能来有效率的运行深度学习模型。

从而,如何提高深度学习模型的运行效率,则是亟待解决的问题。

发明内容

本说明书提供一种基于搜索的深度学习模型部署方法及装置,以部分的解决现有技术存在的上述问题。

本说明书采用下述技术方案:

本说明书提供了一种基于搜索的深度学习模型部署方法,包括:

获取深度学习模型所对应的计算图;

确定所述计算图中包括的算子,并确定每个算子匹配的硬件资源;

根据各算子匹配的硬件资源,构建搜索空间,针对所述搜索空间中包括的每个样本,该样本用于表示一种将算子分配给各硬件资源的分配方案:

从所述搜索空间中选取出目标样本,并确定所述目标样本对应的运行时长,以及确定所述目标样本对应的邻域样本,并确定所述邻域样本对应的运行时长,若所述邻域样本对应的运行时长短于所述目标样本的运行时长,将所述邻域样本作为重新确定出的目标样本,并继续确定目标样本对应的邻域样本以及邻域样本对应的运行时长,直到满足预设迭代终止条件为止;

按照目标样本所对应的分配方案,将深度学习模型的算子进行硬件资源的分配,以对所述深度学习模型进行部署。

可选地,确定每个算子匹配的硬件资源,具体包括:

针对每个算子,确定该算子是否被预设的硬件计算库支持;

若是,根据与该算子相匹配的硬件计算库,确定该算子匹配的硬件资源,若否,确定将该算子分配给深度学习编译器进行编译,以及该算子相匹配的硬件资源为:所述深度学习编译器所对应的默认硬件资源。

可选地,获取深度学习模型所对应的计算图,具体包括:

通过深度学习编译器确定出的所述深度学习模型对应的高级IR,并将所述高级IR进行图优化,得到优化后的计算图;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310557259.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top