[发明专利]基于众核处理器的卷积神经网络运算加速方法及装置有效

专利信息
申请号: 202010223385.3 申请日: 2020-03-26
公开(公告)号: CN111461311B 公开(公告)日: 2023-04-07
发明(设计)人: 吴俊敏;张屹 申请(专利权)人: 中国科学技术大学
主分类号: G06N3/063 分类号: G06N3/063;G06N3/0464;G06F13/28;G06F9/38;G06F9/30;G06T1/40;G06V10/82;G06V10/94
代理公司: 苏州创元专利商标事务所有限公司 32103 代理人: 范晴;丁浩秋
地址: 230027 安*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 处理器 卷积 神经网络 运算 加速 方法 装置
【说明书】:

发明公开了一种基于众核处理器的卷积神经网络运算加速方法,预先将卷积运算的输入图片处理得到输入张量,及卷积滤波器张量;并进行转置,得到转置输入张量和转置卷积滤波器张量;获取的子矩阵d,的子矩阵f,并传输至众核处理器的从核阵列中进行矩阵相乘运算;将相乘得到的子矩阵o从从核阵列传输回主核,更新转置输出张量;基于卷积滤波器复用思想的数据换入换出策略,根据卷积运算的算法公式重复上述步骤,对进行更新;得到最终的输出张量。使用基于卷积滤波器复用的思想重排卷积循环,在循环内采用DMA混合模式传输,提升带宽,减少访存开销,平衡访存与计算时间,加速卷积神经网络运算过程,优化性能。

技术领域

本发明属于数据处理技术领域,具体地涉及一种基于众核处理器的卷积神经网络运算加速方法及装置。

背景技术

卷积神经网络是深度神经网络的一种常见形式,由一个输入层,一个输出层和多个隐藏层组成,这些隐藏层包括卷积层,RELU层,激活函数层,池化层,全连接层与归一化层等。在卷积神经网络中,卷积层与池化层一般会取若干个,卷积层与池化层交替设置,生成输入数据的高级抽象,称为特征图(featur map),最后通过分类相关层如全连接层等对特征图进行处理完成输入数据的分类。卷积神经网络可以通过采用非常深的层次结构来实现卓越的性能,但深层的卷积神经网络需求极大的计算能力。

在大多数的卷积神经网络中,卷积层的运算占据了总计算量的最大部分(占比90%以上)。卷积层的主要运算为高维卷积,卷积运算的输入是两个四维的张量:代表输入数据,代表卷积滤波器。输出也是一个四维的张量:N代表一个批次(mini-batch)输入的图片数量,C代表输入的特征图个数,H与W分别代表输入图片的高度与宽度,K代表输出的特征图个数,R与S分别代表卷积核的高度与宽度,P与Q分别代表输出图片的高度与宽度。卷积运算的算法公式可以表示如下:

当前在不同硬件平台上对卷积神经网络进行高效处理有两种不同的策略:

一种是基于时域的方法,通过对数据进行变换,将卷积运算映射到矩阵乘法,然后使用较为成熟的矩阵运算加速库(如OPEN-BLAS,cuDNN)进行运算加速。

另一种是基于频域的方法,利用空间域的卷积等于频率域的乘积的卷积原理,对卷积核与输入特征矩阵进行类傅里叶变换,然后在频率域中进行乘法运算,最后对所产生的结果应用逆傅里叶变换恢复空间域中的输出特征映射。

众核处理器,比如SW26010异构众核处理器,其是由上海高性能集成电路设计中心通过自主技术研制,集成了4个运算核组共260个运算核心,核组间支持Cache一致性,通过片上网络互联。每个核组包含1个运算控制核心(主核),1个8x8的运算核心阵列(从核阵列),一个内存控制器(MC)。4个核组的物理空间统一编址,运算控制核心和运算核心均可以通过内存控制器访问芯片上的所有主存空间。SW26010的主核(MPE)是一个64位的RISC核心,拥有一个32kb的L1指令Cache、一个32kb的L1数据Cache和一个256kb的L2cache,同时支持256位的向量运算。它的从核也是一个64位的RISC核心,设计目标是实现计算能力的凝集,同时最小化微架构的复杂性。从核阵列按照8x8的结构排列,采用网络互连、支持低延迟的寄存器通信,每个从核拥有16kb的L1指令Cache和一个64kb的便笺式存储器(SPM),并且同样支持256位的向量运算。从核对主存有两种模式的访问:DMA连续传输访存模式,用于细粒度的数据访问的全局读入/读出(gld/gst),带宽极低;DMA跨步传输访存模式,用于粗粒度数据访问的DMA方式,将主存中的连续数据块有效的传输到SPM,带宽较高,也是SPM与主存间的主要通信方式。在8x8的从核阵列上,同行或者同列的两个从核间可以通过寄存器通信的方式高速传输数据。寄存器通信不仅支持同行同列从核之间点对点的通信,同时支持一对多的行列广播通信,寄存器通信的延迟极小,利用寄存器通信可以实现从核之间高效的数据共享。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010223385.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top