[发明专利]一种高能效的神经网络处理器、加速系统及方法有效
申请号: | 201811592475.9 | 申请日: | 2018-12-25 |
公开(公告)号: | CN109615071B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 秦刚;姜凯;李朋 | 申请(专利权)人: | 山东浪潮科学研究院有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 孙园园 |
地址: | 250000 山东省济*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种高能效的神经网络处理器、加速系统及方法,属于神经网络处理装置,要解决的技术问题为:如何减小对乘法器以及数据存储器的读写次数,加速神经网络的计算;其结构包为包含ARM核的主控芯片,包括处理器单元和逻辑计算单元,逻辑计算单元通过总线接口与处理器单元电连接。该系统包括上述主控芯片和存储模块。其方法包括:对权重数据进行选择排序;以数据复用的方式获取输入数据,根据多个PE计算子单元并行计算的方式对权重数据和输入数据进行卷积运算和池化运算;获取上述每个PE计算子单元的输出数据并进行加法运算得到最终数据,并将最终数据存储于存储模块。本发明可减少卷积次数以及对外部存储的读写次数。 | ||
搜索关键词: | 一种 能效 神经网络 处理器 加速 系统 方法 | ||
【主权项】:
1.一种高能效的神经网络处理器,其特征在于为包含ARM核的主控芯片,包括:处理器单元,用于获取输入数据、权重数据并根据神经网络的模型生成指令数据;逻辑计算单元,其通过总线接口与处理器单元电连接,包括指令FIFO子单元、数据FIFO子单元、排序子单元、加法子单元以及多个PE计算子单元,其中:指令FIFO子单元,用于实现指令数据的FIFO,并根据指令数据激活适量个数的PE计算子单元以及PE计算子单元的资源;数据FIFO子单元,用于实现权重数据和输入数据的FIFO;排序子模块,用于基于为正数的权重数据优先输出、为负数的权重数据后输出、为零的权重数据不输出的原则,依序输出权重数据和输入数据;PE计算子单元,用于对权重数据和输入数据进行卷积运算和池化运算,并用于判断是否自动终止卷积运算;上述PE计算子单元共多个,其以数据复用的方式获取输入数据,并通过并行计算的方式对权重数据和输入数据进行卷积运算和池化运算;加法子单元,用于对上述多个PE计算子单元输出的数据进行加法运算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东浪潮科学研究院有限公司,未经山东浪潮科学研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811592475.9/,转载请声明来源钻瓜专利网。