[发明专利]人工神经网络处理装置有效
申请号: | 201710258566.8 | 申请日: | 2017-04-19 |
公开(公告)号: | CN107679620B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 方绍峡;隋凌志;于谦;王俊斌;单羿 | 申请(专利权)人: | 赛灵思公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06N3/063 |
代理公司: | 北京卓孚律师事务所 11821 | 代理人: | 任宇 |
地址: | 美国加利福尼亚*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人工 神经网络 处理 装置 | ||
本申请公开一种用于运行神经网络的处理器,其包括内存控制器组、片上总线和处理器内核。处理器内核进一步包括:寄存器、第一指令单元、第二指令单元、指令分发单元、数据传输控制器、缓存模块和计算模块。该处理器支持多种神经网络算法并且可以显著提高运算效率。
发明领域
本申请涉及人工神经网络,例如卷积神经网络(CNN)。更具体地,本申请涉及一种用于实现人工神经网络的处理装置。
背景技术
人工智能近年得到迅速发展,极大地影响了人们的生活。基于人工神经网络,尤其是卷积神经网络(CNN,Convolutional Neural Network)的方法在很多应用中、例如在计算机视觉领域中得到广泛使用。
图1示出了典型的深度卷积神经网络(CNN)的实施例。如图1所示,典型的CNN由一系列有序运行的层组成。
CNN模型的参数被称为“权重”。CNN的第一层读取输入图像,并输出一系列的特征图。下一层读取由上一层产生的特征图,并输出新的特征图。最后,一个分类器输出输入图像可能属于的每一类别的概率。CNN中两种基本层类型包括卷积层(CONV层)和全连层(FC层),在CONV层之后通常有池化层(Pooling层)。
例如,对于一个CNN层,表示第j个输入特征图,表示第i个输出特征图,bi表示第i个输出图的偏置项。对于CONV层,nin和nout分别代表输入和输出特征图的数量。对于FC层,nin和nout分别代表输入和输出特征向量的长度。
此时,CONV层以一系列特征图作为输入,并以卷积内核卷积获得输出特征图。通常与CONV层相连的非线性层,即,非线性激励函数被施加到输出特征图中的每个元素。
CONV层可以用表达式(1)表示:
其中,gi,j是应用到第j个输入特征图和第i个输出特征图的卷积内核。
FC层是应用于输入特征向量上的一个线性变换,其可以用表达式(2)表示:
fout=Wfin+b (2)
其中,W是一个nout×nin变换矩阵,b是偏置项。应注意,对于FC层,输入的不是几个二维特征图的组合,而是一个特征向量。因此,在表达式(2)中,参数nin和nout实际上对应于输入和输出特征向量的长度。
池化层通常与CONV层相连,用于输出每个特征图中的每个分区的最大值或平均值。池化层的最大值可以由表达式(3)表示:
其中,p是池化内核的大小。这种非线性的“降采样”不仅为下一层降低了特征图的大小和计算,还提供了一种平移不变性。
相较于传统算法,CNN需要较高的运算量与带宽需求。目前主要依靠中央处理器(CPU)阵列、图形处理器(GPU)阵列完成计算。然而,CPU、GPU等通用处理器不能充分利用卷积神经网络的特点,因此导致运算效率较低,带来了较大的功耗、成本开销。此外,如今愈发需要在终端设备上以低成本、低功耗、高性能来完成人工智能算法的计算,而现有通用处理器无法满足该需求。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于赛灵思公司,未经赛灵思公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710258566.8/2.html,转载请声明来源钻瓜专利网。