[发明专利]提高神经网络阵列的性能有效
申请号: | 201980010993.1 | 申请日: | 2019-01-30 |
公开(公告)号: | CN111684473B | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | D·M·万特雷斯;R·戴尔蒙特 | 申请(专利权)人: | 亚马逊技术股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06F15/80 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 钱慰民;张鑫 |
地址: | 美国华*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 提高 神经网络 阵列 性能 | ||
1.一种用于神经网络计算的电路,其包括:
二维阵列,所述二维阵列包括布置成行和列的处理元件PE,其中每行映射到相应的输入数据集,并且每列映射到相应的输出数据集,每个输入数据集包括相应的Xin元素,每个PE包括:
存储器,所述存储器用于为给定PE缓存权重值;
第一输入端口,所述第一输入端口用于接收给定行的输入数据集的第一Xin元素;
第二输入端口,所述第二输入端口用于接收所述给定行的所述输入数据集的第二Xin元素,所述第二Xin元素与所述第一Xin元素是连续的;
第三输入端口,所述第三输入端口用于接收给定列的第一Yin元素;
第四输入端口,所述第四输入端口用于接收所述给定列的第二Yin元素;
第一乘法器,所述第一乘法器被配置成将所述第一Xin元素与所述权重值相乘以生成第一乘法结果;
第一加法器,所述第一加法器被配置成将所述第一乘法结果与所述第一Yin元素相加以生成第一Yout元素;
第二乘法器,所述第二乘法器被配置成与所述第一乘法器并发将所述第二Xin元素与所述权重值相乘以生成第二乘法结果;以及
第二加法器,所述第二加法器被配置成与所述第一加法器并发将所述第二乘法结果与所述第二Yin元素相加以生成第二Yout元素,
其中所述二维阵列中的最后一行的所述第一Yout元素和所述第二Yout元素对应于所述给定列的输出数据集。
2.根据权利要求1所述的电路,其中所述第一Xin元素和所述第二Xin元素分别对应于输入特征图的第一特征图元素和第二特征图元素。
3.根据权利要求1所述的电路,其中所述第一输入端口和所述第二输入端口耦合到行输入数据总线。
4.根据权利要求1所述的电路,其中所述第三输入端口和所述第四输入端口耦合到列输入数据总线。
5.一种用于神经网络计算的设备,其包括:
处理元件PE,所述PE用于神经网络计算,所述PE被配置成:
通过第一接口并发接收两个连续Xin元素,所述两个连续Xin元素包括第一Xin元素和第二Xin元素;
通过第二接口并发接收两个Yin元素,所述两个Yin元素包括第一Yin元素和第二Yin元素;
对所述第一Xin元素和权重值并发执行乘法运算以生成第一中间结果,并且对所述第二Xin元素和所述权重值并发执行所述乘法运算以生成第二中间结果;并且
对所述第一中间结果和所述第一Yin元素并发执行加法运算以生成第一Yout元素,并且对所述第二中间结果和所述第二Yin元素并发执行所述加法运算以生成第二Yout元素;
其中所述PE是呈阵列的多个PE之一,并且其中所述阵列中的最后一行的所述第一Yout元素和所述第二Yout元素对应于与所述阵列中的给定列相关联的输出数据集。
6.根据权利要求5所述的设备,其中所述第一中间结果是使用第一乘法器生成的,并且所述第二中间结果是使用第二乘法器生成的。
7.根据权利要求6所述的设备,其中所述第一Yout元素是使用第一加法器生成的,并且所述第二Yout元素是使用第二加法器生成的。
8.根据权利要求5所述的设备,其中所述乘法运算和所述加法运算是使用融合乘法器加法器在单个步骤中执行。
9.根据权利要求5所述的设备,其中所述阵列是二维的并且布置成行和列,其中每行映射到相应的输入数据集,并且每列映射到相应的输出数据集。
10.根据权利要求9所述的设备,其中所述第一接口与所述阵列的行相关联,并且其中所述PE的所述第一Xin元素和所述第二Xin元素对应于与所述行相关联的输入数据集。
11.根据权利要求9所述的设备,其中所述第二接口与所述阵列的列相关联。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于亚马逊技术股份有限公司,未经亚马逊技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980010993.1/1.html,转载请声明来源钻瓜专利网。