[发明专利]模型分配方法、装置、电子设备及计算机可读存储介质在审

专利信息
申请号: 202110997538.4 申请日: 2021-08-27
公开(公告)号: CN113703975A 公开(公告)日: 2021-11-26
发明(设计)人: 张发恩;林国森 申请(专利权)人: 创新奇智(重庆)科技有限公司
主分类号: G06F9/50 分类号: G06F9/50;G06N3/063
代理公司: 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 代理人: 衡滔
地址: 400000 重庆市九龙坡区*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 分配 方法 装置 电子设备 计算机 可读 存储 介质
【权利要求书】:

1.一种模型分配方法,其特征在于,所述方法包括:

获取各待分配模型;

获取针对所述待分配模型的所有分配组合方案中,各嵌入式神经网络处理器NPU中的第一资源使用指标值;各所述NPU中的第一资源使用指标值表征各所述NPU中的资源使用情况;

根据各所述分配组合方案下的各NPU中的第一资源使用指标值,确定出第一资源使用指标值最均衡的目标分配组合方案;

按照所述目标分配组合方案将各所述待分配模型分别加载至对应的NPU中。

2.如权利要求1所述的模型分配方法,其特征在于,获取针对所述待分配模型的所有分配组合方案中,各NPU中的第一资源使用指标值,包括:

获取各待分配模型分别在各NPU中的第二资源使用指标值;所述第二资源使用指标值表征待分配模型在NPU中的资源使用情况;

根据各分配组合方案中各NPU所对应的待分配模型,以及各待分配模型在所对应的NPU中的第二资源使用指标值,确定出各分配组合方案中各NPU中的第一资源使用指标值。

3.如权利要求1所述的模型分配方法,其特征在于,根据各所述分配组合方案下的各NPU中的资源使用指标值,确定出第一资源使用指标值最均衡的目标分配组合方案,包括:

分别计算各所述分配组合方案对应的各第一资源使用指标值的方差值;

确定方差值最小的分配组合方案为所述目标分配组合方案。

4.如权利要求1所述的模型分配方法,其特征在于,所述第一资源使用指标值包括以下至少之一:

NPU的占用内存;

NPU对应的所有待分配模型的总运行时长。

5.如权利要求2所述的模型分配方法,其特征在于,所述第二资源使用指标值包括以下至少之一:

待分配模型在NPU中的占用内存;

待分配模型在NPU中运行时的运行时长。

6.如权利要求1-5任一项所述的模型分配方法,其特征在于,在确定出第一资源使用指标值最均衡的目标分配组合方案之后,按照所述目标分配组合方案将各所述待分配模型分别加载至对应的NPU中之前,所述方法还包括:

获取所述目标分配组合方案中,各所述NPU所对应的各待分配模型所需占用的内存总和;

确定各所述NPU对应的所述内存总和均分别小于各所述NPU自身的剩余内存值。

7.如权利要求6所述的模型分配方法,其特征在于,所述方法还包括:

若所述目标分配组合方案中,存在至少一个NPU对应的内存总和不小于自身的剩余内存值,则确定第一资源使用指标值次均衡的分配组合方案为所述目标分配组合方案。

8.一种模型分配装置,其特征在于,包括:获取模块、确定模块和分配模块;

所述获取模块,用于获取各待分配模型,以及用于获取针对所述待分配模型的所有分配组合方案中,各嵌入式神经网络处理器NPU中的第一资源使用指标值;各所述NPU中的第一资源使用指标值表征各所述NPU中的资源使用情况;

所述确定模块,用于根据各所述分配组合方案下的各NPU中的第一资源使用指标值,确定出第一资源使用指标值最均衡的目标分配组合方案;

所述分配模块,用于按照所述目标分配组合方案将各所述待分配模型分别加载至对应的NPU中。

9.一种电子设备,其特征在于,包括:处理单元、存储器及通信总线;

所述通信总线用于实现所述处理单元和存储器之间的连接通信;

所述处理单元用于执行存储器中存储的一个或者多个程序,以实现如权利要求1至7中任一项所述的模型分配方法。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1至7中任一项所述的模型分配方法。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新奇智(重庆)科技有限公司,未经创新奇智(重庆)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110997538.4/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top