[发明专利]用于神经网络的处理系统和处理方法有效
申请号: | 201711041164.9 | 申请日: | 2017-10-30 |
公开(公告)号: | CN107818367B | 公开(公告)日: | 2020-12-29 |
发明(设计)人: | 韩银和;闵丰;许浩博;王颖 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 神经网络 处理 系统 方法 | ||
本发明提供了一种神经网络处理系统。该处理系统包括:计算阵列,用于执行神经元和权值的乘法和累加操作;控制单元,用于控制所述计算阵列的数据传递和加载,其中,所述计算阵列包括:至少一个列处理单元,由多个乘法单元构成,并用于执行神经元和权值的乘法运算,以输出乘积结果;至少一个列累加单元,与所述列处理单元相连,并用于对所述列处理单元的多个乘积结果进行累加;至少一个列暂存单元,与所述列累加单元相连,并用于存储所述列累加单元的计算结果。利用本发明的处理系统,在计算过程中能够实现神经元循环使用,从而提高了计算效率和资源利用率。
技术领域
本发明涉及深度学习技术领域,尤其涉及一种用于神经网络的处理系统和处理方法。
背景技术
近年来,深度学习技术得到了飞速的发展,在解决高级抽象认知问题,例如图像识别、语音识别、自然语言理解、天气预测、基因表达、内容推荐和智能机器人等领域得到了广泛应用,成为学术界和工业界的研究热点。
深度神经网络是人工智能领域具有最高发展水平的感知模型之一,该类网络通过建立模型模拟人类大脑的神经连接结构,通过多个变换阶段分层对数据特征进行描述,为图像、视频和音频等大规模数据处理任务带来突破性进展。深度神经网络模型结构是一种运算模型,由大量节点通过网状互连结构构成,这些节点被称为神经元。每两个节点间连接强度都代表通过该连接信号在两个节点间的加权重,即权重,与人类神经网络中的记忆相对应。
然而,实现深度学习技术依赖于极大的计算量。在训练阶段,需要在海量数据中通过反复迭代计算得到神经网络中的权重数据;在推理阶段,同样需要神经网络在极短的响应时间(通常为毫秒级)内完成对输入数据的运算处理。神经网络中涉及的计算主要包括卷积操作、池化操作等,例如,卷积操作是将输入的神经元或称像素与相应卷积核的权值进行乘累加处理,卷积操作和池化操作占用了神经网络处理的大部分时间,因此,提高卷积操作和池化操作的计算效率,能够有效降低神经网络的处理时间。随着神经网络运算的规模越来越大、数据吞吐量越来越高,运行功耗成为一个严重问题。
因此,需要对现有技术进行改进,以提高神经网络的计算效率并降低运行能耗。
发明内容
本发明的目的在于克服上述现有技术的缺陷,提供一种用于神经网络的处理系统和处理方法。
根据本发明的第一方面,提供了一种神经网络处理系统。该处理系统包括:
计算阵列,用于执行神经元和权值的乘法和累加操作;
控制单元,用于控制所述计算阵列的数据传递和加载;
其中,所述计算阵列包括:
至少一个列处理单元,由多个乘法单元构成,并用于执行神经元和权值的乘法运算,以输出乘积结果;
至少一个列累加单元,与所述列处理单元相连,并用于对所述列处理单元的多个乘积结果进行累加;
至少一个列暂存单元,与所述列累加单元相连,并用于存储所述列累加单元的计算结果。
在一个实施例中,所述计算阵列组织为二维矩阵形式,二维矩阵的行数是一个所述列处理单元包含的乘法单元的数目,二维矩阵的列数是所述列处理单元的数目。
在一个实施例中,所述控制单元基于所述计算阵列的规模确定神经元的分批策略和权值的分批策略。
在一个实施例中,所述神经元的分批策略是:将针对所有输入特征图的一个卷积域范围的神经元作为一个神经元批次,该一个神经元批次包括多个神经元组,每个神经元组包含的神经元数目等于所述计算阵列的第一列所包含的乘法单元数目。
在一个实施例中,所述权值的分批策略是:将一个神经元集群所需的权值作为一个权值批次,其中,该一个神经元集群包含的神经元数目等于所述计算阵列的乘法单元数目。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711041164.9/2.html,转载请声明来源钻瓜专利网。