[发明专利]一种高能效的神经网络处理器、加速系统及方法有效
申请号: | 201811592475.9 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109615071B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 秦刚;姜凯;李朋 | 申请(专利权)人: | 山东浪潮科学研究院有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250000 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 能效 神经网络 处理器 加速 系统 方法 | ||
1.一种高能效的神经网络处理器,其特征在于为包含ARM核的主控芯片,包括:
处理器单元,用于获取输入数据、权重数据并根据神经网络的模型生成指令数据;
逻辑计算单元,其通过总线接口与处理器单元电连接,包括指令FIFO子单元、数据FIFO子单元、排序子单元、加法子单元以及多个PE计算子单元,其中:
指令FIFO子单元,用于实现指令数据的FIFO,并根据指令数据激活适量个数的PE计算子单元以及PE计算子单元的资源;
数据FIFO子单元,用于实现权重数据和输入数据的FIFO;
排序子模块,用于基于为正数的权重数据优先输出、为负数的权重数据后输出、为零的权重数据不输出的原则,依序输出权重数据和输入数据;
PE计算子单元,用于对权重数据和输入数据进行卷积运算和池化运算,并用于判断是否自动终止卷积运算;
上述PE计算子单元共多个,其以数据复用的方式获取输入数据,并通过并行计算的方式对权重数据和输入数据进行卷积运算和池化运算;
加法子单元,用于对上述多个PE计算子单元输出的数据进行加法运算;
PE计算子单元包括:
多个卷积计算微单元,用于以数据复用的方式获取输入数据,通过串行计算的方式对权重数据和输入数据进行卷积运算;
激活函数,配置为relu函数,用于判断是否终止卷积计算微单元内的卷积运算,判断原则为:如果卷积计算微单元内对当前M个权重数据和相关的输入数据的卷积运算为负数,则自动终止卷积计算微单元内的卷积运算并输出零;否则,对N个权重数据和相关的输入数据进行卷积运算并输出为正数的卷积数据;其中,MN,N为位于卷积计算微单元内的权重数据的总数;
池化层,用于对每个卷积计算微单元的输出数据进行池化操作。
2.根据权利要求1所述的一种高能效的神经网络处理器,其特征在于逻辑计算单元还包括:
压缩/解压单元,用于按照神经网络的层次并根据游程编码压缩算法对权重数据进行压缩,或者对压缩后的权重数据进行无损解压。
3.根据权利要求1所述的一种高能效的神经网络处理器,其特征在于逻辑计算单元还包括:
缓存子单元,用于暂存权重数据、输入数据以及指令数据。
4.根据权利要求1所述的一种高能效的神经网络处理器,其特征在于总线接口为AXI接口,其支持DMA数据传输方式。
5.根据权利要求1所述的一种高能效的神经网络处理器,其特征在于所述主控芯片为zynq芯片,zynq芯片的PS端作为处理器单元,zynq芯片的PL端作为逻辑计算单元。
6.一种高能效的神经网络加速系统,其特征在于包括:
如权利要求1-4任一项所述的一种高能效的神经网络处理器;
和存储模块,与主控芯片电连接,用于存储权重数据以及加法单元的输出数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮科学研究院有限公司,未经山东浪潮科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811592475.9/1.html,转载请声明来源钻瓜专利网。