[发明专利]一种基于搜索的深度学习模型部署方法及装置有效
申请号: | 202310557259.5 | 申请日: | 2023-05-17 |
公开(公告)号: | CN116306856B | 公开(公告)日: | 2023-09-05 |
发明(设计)人: | 王鹏程;李勇;陈自强;吕波;程稳;曾令仿;陈光;胡陈枢 | 申请(专利权)人: | 之江实验室 |
主分类号: | G06N3/065 | 分类号: | G06N3/065;G06F8/41 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 邓超 |
地址: | 311121 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 搜索 深度 学习 模型 部署 方法 装置 | ||
本说明书公开了一种基于搜索的深度学习模型部署方法及装置,可以获取深度学习模型所对应的计算图,确定计算图中包括的算子,并确定每个算子匹配的硬件资源,而后,根据各算子匹配的硬件资源,构建搜索空间,从搜索空间中选取出目标样本,并确定目标样本对应的运行时长,以及确定目标样本对应的邻域样本,并确定邻域样本对应的运行时长,若邻域样本对应的运行时长短于目标样本的运行时长,将邻域样本作为重新确定出的目标样本,并继续确定目标样本对应的邻域样本以及对应的运行时长,直到满足预设迭代终止条件为止,按照目标样本所对应的分配方案,对深度学习模型的算子进行硬件资源的分配,以进行部署,本方法可以提高深度学习模型的计算效率。
技术领域
本说明书涉及深度学习、编译技术、高性能计算交叉技术领域,尤其涉及一种基于搜索的深度学习模型部署方法及装置。
背景技术
近年来,深度学习技术已经广泛应用于机器视觉、自然语言处理、自动驾驶等多个领域并取得了显著效果。随着深度学习模型结构越来越复杂,参数量越来越大,如何保证模型的性能成了一个关键问题。
在实际应用中,可以采用更高性能的硬件来运行深度学习模型,目前,市场上存在神经网络专用的加速芯片。当然,还可以采用深度学习编译器,来对深度学习模型进行构建以及优化,采用深度学习编译器的方式,可由中央处理器(graphics processing unit,cpu)、显卡(graphics processing unit,gpu)等来运行深度学习模型。
在实际的部署场景中可以将深度学习模型部署在多个硬件上,如,同时部署在cpu、gpu和多种神经网络加速芯片上,但是,当前将深度学习模型部署在多个硬件上的方式,可以是依据人为经验,将深度学习模型指定的部分分配给指定的某些硬件进行运行,从而不一定能够发挥最高的性能来有效率的运行深度学习模型。
从而,如何提高深度学习模型的运行效率,则是亟待解决的问题。
发明内容
本说明书提供一种基于搜索的深度学习模型部署方法及装置,以部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种基于搜索的深度学习模型部署方法,包括:
获取深度学习模型所对应的计算图;
确定所述计算图中包括的算子,并确定每个算子匹配的硬件资源;
根据各算子匹配的硬件资源,构建搜索空间,针对所述搜索空间中包括的每个样本,该样本用于表示一种将算子分配给各硬件资源的分配方案:
从所述搜索空间中选取出目标样本,并确定所述目标样本对应的运行时长,以及确定所述目标样本对应的邻域样本,并确定所述邻域样本对应的运行时长,若所述邻域样本对应的运行时长短于所述目标样本的运行时长,将所述邻域样本作为重新确定出的目标样本,并继续确定目标样本对应的邻域样本以及邻域样本对应的运行时长,直到满足预设迭代终止条件为止;
按照目标样本所对应的分配方案,将深度学习模型的算子进行硬件资源的分配,以对所述深度学习模型进行部署。
可选地,确定每个算子匹配的硬件资源,具体包括:
针对每个算子,确定该算子是否被预设的硬件计算库支持;
若是,根据与该算子相匹配的硬件计算库,确定该算子匹配的硬件资源,若否,确定将该算子分配给深度学习编译器进行编译,以及该算子相匹配的硬件资源为:所述深度学习编译器所对应的默认硬件资源。
可选地,获取深度学习模型所对应的计算图,具体包括:
通过深度学习编译器确定出的所述深度学习模型对应的高级IR,并将所述高级IR进行图优化,得到优化后的计算图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310557259.5/2.html,转载请声明来源钻瓜专利网。