[发明专利]多处理器并行神经网络加速方法、装置、设备和存储介质在审
申请号: | 202110226972.2 | 申请日: | 2021-03-01 |
公开(公告)号: | CN112884127A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 陈志杰;方夏章;李跃文 | 申请(专利权)人: | 厦门美图之家科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 北京清大紫荆知识产权代理有限公司 11718 | 代理人: | 黄贞君;张卓 |
地址: | 361006 福建省厦门市厦*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 处理器 并行 神经网络 加速 方法 装置 设备 存储 介质 | ||
1.一种多处理器并行神经网络加速方法,其特征在于,包括:
获取所述多处理器中各处理器运行神经网络的理论运算过程,所述多处理器包含多种不同类型的处理器;
统计整个神经网络中每一层层结构的计算量;
基于所述神经网络的层连接关系,将所述神经网络拆分成多个子网络;
根据所述理论运算过程和所述计算量将所述子网络分配到所述处理器生成多种组合,并纪录各组合的处理器运行时间;
筛选出所述处理器运行时间最少的组合,并将所述子网络固定分配给所述处理器。
2.根据权利要求1所述的多处理器并行神经网络加速方法,其特征在于,获取所述多处理器中各处理器运行神经网络的理论运算过程,包括:
获取所述多处理器中各处理器分别运行所述神经网络的输入层、卷积层、池化层、全连接层或者神经网络其他层的理论运算过程。
3.根据权利要求1所述的多处理器并行神经网络加速方法,其特征在于,所述统计整个神经网络中每一层层结构的计算量,包括:
统计整个网络中整个神经网络中每一层层结构需要的乘法和加法的次数;
计算所述次数对应的计算量。
4.根据权利要求1所述的多处理器并行神经网络加速方法,其特征在于,所述基于所述神经网络的层连接关系,将所述神经网络拆分成多个子网络,包括:
根据所述计算量的数值,逐层获取层结构以及与该层结构数据处理相关的关联层;
判断所述关联层是否与多个层结构并行关联;
确定判定为否的关联层与相关的所述层结构属于一个子网络。
5.根据权利要求1所述的多处理器并行神经网络加速方法,其特征在于,所述根据所述理论运算过程和所述计算量将所述子网络分配到所述处理器生成多种组合,包括:
根据所述计算量确定可运行所述子网络的所述处理器;
判断所述子网络是否存在可并行运行的关联网络;
将判定存在可并行运行的子网络和关联网络分配到不同的所述处理器上,生成多种所述子网络和所述处理器组合。
6.一种多处理器并行神经网络加速装置,其特征在于,所述装置包括:
获取模块,用于获取所述多处理器中各处理器运行神经网络的理论运算过程,所述多处理器包含多种不同类型的处理器;
计算量统计模块,用于统计整个神经网络中每一层层结构的计算量;
网络拆分模块,用于基于所述神经网络的层连接关系,将所述神经网络拆分成多个子网络;
分配模块,用于根据所述理论运算过程和所述计算量将所述子网络分配到所述处理器生成多种组合,并纪录各组合的处理器运行时间;
筛选模块,用于筛选出所述处理器运行时间最少的组合,并将所述子网络固定分配给所述处理器。
7.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门美图之家科技有限公司,未经厦门美图之家科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110226972.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:测距系统和测距方法
- 下一篇:一种机动车自动节能减排系统