[发明专利]可重配置神经处理单元的SRAM共享在审
申请号: | 202210644165.7 | 申请日: | 2022-06-08 |
公开(公告)号: | CN115469828A | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 申宗勋;A.沙菲阿德斯塔尼;J.H.哈松 | 申请(专利权)人: | 三星电子株式会社 |
主分类号: | G06F7/544 | 分类号: | G06F7/544;G06N3/063;G11C11/413 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 邵亚丽 |
地址: | 韩国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 配置 神经 处理 单元 sram 共享 | ||
1.一种神经处理单元NPU的内核,包括:
布置成N行和N列的NPU的N×N阵列,其中N是大于等于2的整数,每个NPU包括存储器和耦接到所述存储器的卷积乘法累加MAC电路,所述存储器能够接收、存储和输出输入特征图IFM值、核值和输出特征图OFM值,
所述NPU的N×N阵列被配置为通过以下步骤处理IFM数据:
存储IFM值阵列的IFM值,使得所述IFM值阵列的IFM值的每个相应行被顺序存储在沿所述NPU的N×N阵列的对角线定位的NPU的相应存储器中;
将存储在位于当前对角线中的每个NPU的存储器中的IFM值广播到与该NPU位于同一行的其他NPU的存储器;
对于所述NPU的N×N阵列的每一行,将广播到该行中的NPU的存储器的IFM值乘以存储在该行中的每个相应NPU的存储器中的核值,以形成该NPU的乘积值PV;
对于所述NPU的N×N阵列的每一列,将列中的所有乘积值PV相加以形成该列的OFM值;
将每个相应OFM值存储在位于当前对角线中的NPU的存储器中;以及
重复广播、乘法、相加和存储,直到所述NPU的N×N阵列的所有对角线都被处理。
2.根据权利要求1所述的NPU的内核,其中,每个OFM值存储在对应于该OFM值的下一层的IFM值的NPU位置中。
3.根据权利要求1所述的NPU的内核,其中,N包括2、4、8、16、32和64中的一个。
4.根据权利要求1所述的NPU的内核,其中,每个NPU的存储器包括静态随机存取存储器SRAM。
5.根据权利要求1所述的NPU的内核,其中,所述N行包括行ri-rN,所述N列包括列cj-cN,并且所述N个对角线包括对角线dk-dN,其中i是1和N之间的整数值,包含1和N,j是1和N之间的整数值,包含1和N,并且k是1和N之间的整数值,包含1和N,
其中,每个对角线包括N个NPU,并且第k个对角线dk在从行ri中的第j个NPU朝向行ri+1和列cj+1中的NPU的方向上延伸,并且绕到行rN-i中的NPU。
6.根据权利要求5所述的NPU的内核,其中,存储IFM值阵列的IFM值还包括通过将矩阵A的第i行中的每个IFM值xi1-xiN顺序存储在位于所述NPU的N×N阵列的第i个对角线中的NPU的存储器中来接收N×N矩阵A的IFM值x,
其中,广播还包括将存储在对角线dk中的NPU的存储器中的每个相应IFM值x广播到所述NPU的N×N阵列的行rk中的每个其他NPU的存储器,
其中,乘法还包括对于所述NPU的N×N阵列的每一行ri-rN,将广播到该行中的NPU的存储器的IFM值x乘以存储在该行中的每个相应NPU的存储器中的核值,以形成乘积值PVij,其中j表示对应于所述乘积值的列,
其中,相加还包括对于所述NPU的N×N阵列的每一列c1-cN,将NPU的第j列中的所有乘积值PVij相加以形成所述NPU的N×N阵列的每个相应列的OFMj值,并且
其中,存储还包括将每个相应OFMj存储在位于对角线dk中的NPU的存储器中。
7.根据权利要求1所述的NPU的内核,其中,N包括4,并且
其中,使用NPU中的8位数据路径来处理四个像素的IFM数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于三星电子株式会社,未经三星电子株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210644165.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有传感器组件的盘式制动器组件
- 下一篇:节流阀装置