[发明专利]一种神经网络芯片有效
申请号: | 201710890838.6 | 申请日: | 2017-09-27 |
公开(公告)号: | CN108205704B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 李清正;毛宁元;刘文志 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 深圳中一专利商标事务所 44237 | 代理人: | 姚泽鑫 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 神经网络 芯片 | ||
本发明提供一种神经网络芯片,用于高新的实现卷积神经网络运算。包括:深度学习运算模块,数据采集模块,数据输出模块,数据存储模块,处理器;所述深度学习运算模块用于对输入数据进行深度学习运算,所述深度学习运算包括并行的乘法运算以及加法树的累积运行;所述数据采集模块用于对输入数据进行数据采集;所述数据输出模块用于输出所述神经网络芯片运算的运算结果。所述处理器用于调度所述深度学习运算模块,所述数据采集模块和数据输出模块间的数据交互,并处理非深度学习的运算。
技术领域
本发明涉及硬件芯片技术领域,具体涉及一种神经网络芯片。
背景技术
深度学习是近年来人工智能领域的一个热点分支,经过模拟人脑的神经元处理机制,来分析和解释数据信息,例如:图像,声音,文本。
深度学习的提出使得人工神经网络重新成为机器学习领域的重要研究方向,卷积神经网络(CNN,Convolutional Neural Network)算法近年来广泛应用于图像处理,模式识别等领域,它具有结构简单,适应性强,鲁棒性高等特点。
卷积神经网络由大量的节点(或称“神经元”,或“单元”)和之间相互联接构成。每个节点代表一种特定的输出函数,称为激励函数(activation function)。每两个节点间的连接都代表一个对于通过该连接信号的加权值,称之为权重(weight),这相当于卷积神经网络的记忆。由于卷积神经网络的复杂性,因此卷积神经网络的数据运算是业界的一个难题。
现有的卷积神经网络有以下两种芯片架构实现方式:
1、基于图像处理器(GPU,Graphics Processing Unit)架构的设计,芯片架构如图1所示。
2、基于现场可编程阵列(FPGA,Field-Programmable Gate Array)架构的设计,芯片架构如图2所示。
无论GPU架构,还是FPGA架构,在运行深度学习计算时,由于需要用通用的计算模块去处理深度学习的不同运算逻辑,由于通用性导致很多运算逻辑不能高效的完成。
发明内容
本发明提供一种神经网络芯片,用于高新的实现深度神经网络运算。
本发明提供的神经网络芯片包括:
深度学习运算模块101,数据采集模块102,数据输出模块103,数据存储模块104,处理器105;
所述深度学习运算模块101用于对输入数据进行深度学习运算;所述深度学习运算包括并行的乘法运算以及加法树的累积运行。
所述数据采集模块102用于对输入数据进行数据采集;所述数据输出模块103用于输出所述神经网络芯片运算的运算结果;
所述处理器105用于调度调度所述深度学习运算模块,所述数据采集模块和数据输出模块间的数据交互,并处理非深度学习的运算;;
所述数据存储模块104分别与所述深度学习运算模块101,所述数据采集模块102和数据输出模块103相连接。
可选的,所述数据存储模块104包括:片外存储器1041,存储器控制器1042;
所述存储器控制器1042分别与所述深度学习运算模块101,所述数据采集模块102和数据输出模块103相连接;
所述存储器控制器1042与片外存储器1041相连接,所述存储器控制器1042用于控制所述片外存储器1041的数据读写。
可选的,所述深度学习运算模块101包括:卷积运算单元1011,池化运算单元1012,全连接运算单元1013和计算调度单元1014;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710890838.6/2.html,转载请声明来源钻瓜专利网。