[发明专利]一种运行深度学习模型的方法、装置及介质在审
申请号: | 202010918324.9 | 申请日: | 2020-09-02 |
公开(公告)号: | CN111984423A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 李滨;卢旭辉;温帅 | 申请(专利权)人: | 北京小米松果电子有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/48;G06N20/00 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 白莹 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 运行 深度 学习 模型 方法 装置 介质 | ||
1.一种运行深度学习模型的方法,其特征在于,包括:
确定用于处理深度学习模型中每个计算任务的硬件运算单元,每个计算任务对应一硬件运算单元,所述深度学习模型包括按依次排列的一个以上的计算任务;
为每两个相邻计算任务分配共用内存,在相邻计算任务对应的硬件运算单元不相同时,为所述相邻计算任务分配内存类型为零拷贝类型的共用内存;
使用所述共用内存运行所述深度学习模型。
2.如权利要求1所述的方法,其特征在于,
所述方法还包括:
在相邻计算任务对应的硬件运算单元相同时,为所述相邻计算任务分配内存类型为非零拷贝类型的共用内存。
3.如权利要求1所述的方法,其特征在于,
所述方法还包括:
在相邻计算任务对应的硬件运算单元相同时,为所述相邻计算任务分配内存类型为零拷贝类型的共用内存。
4.如权利要求1所述的方法,其特征在于,
所述方法还包括:分配用于存储所述深度学习模型的输入数据的输入内存,所述输入内存的类型为零拷贝类型;
分配用于存储所述深度学习模型的输出数据的输出内存,所述输出内存的类型为零拷贝类型。
5.如权利要求1所述的方法,其特征在于,
所述方法还包括:根据每个计算任务的运算能力设置用于处理每个计算任务的硬件运算单元。
6.一种运行深度学习模型的装置,其特征在于,包括:
第一确定模块,被配置为确定用于处理深度学习模型中每个计算任务的硬件运算单元,每个计算任务对应一硬件运算单元,所述深度学习模型包括按依次排列的一个以上的计算任务;
第一分配模块,被配置为每两个相邻计算任务分配共用内存,在相邻计算任务对应的硬件运算单元不相同时,为所述相邻计算任务分配内存类型为零拷贝类型的共用内存;
运行模块,被配置为使用所述共用内存运行所述深度学习模型。
7.如权利要求6所述的装置,其特征在于,
所述第一分配模块,还配置为在相邻计算任务对应的硬件运算单元相同时,为所述相邻计算任务分配内存类型为非零拷贝类型的共用内存。
8.如权利要求6所述的装置,其特征在于,
所述第一分配模块,还配置为在相邻计算任务对应的硬件运算单元相同时,为所述相邻计算任务分配内存类型为零拷贝类型的共用内存。
9.如权利要求6所述的装置,其特征在于,
所述装置还包括:
第二分配模块,被配置为分配用于存储所述深度学习模型的输入数据的输入内存,所述输入内存的类型为零拷贝类型;分配用于存储所述深度学习模型的输出数据的输出内存,所述输出内存的类型为零拷贝类型。
10.如权利要求6所述的装置,其特征在于,
所述装置还包括:
设置模块,被配置为根据每个计算任务的运算能力设置用于处理每个计算任务的硬件运算单元。
11.一种运行深度学习模型的装置,其特征在于,包括:
处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为执行所述权利要求1至5中任一权利要求所述的方法。
12.一种非临时性计算机可读存储介质,当所述存储介质中的指令由移动终端的处理器执行时,使得移动终端能够执行所述权利要求1至5中任一权利要求所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米松果电子有限公司,未经北京小米松果电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010918324.9/1.html,转载请声明来源钻瓜专利网。