[发明专利]运行时可重新配置的神经网络处理器核在审
申请号: | 201980036708.3 | 申请日: | 2019-06-13 |
公开(公告)号: | CN112204579A | 公开(公告)日: | 2021-01-08 |
发明(设计)人: | A·S·卡斯迪;R·奥普斯瓦密;J·V·阿尔苏尔;P·达塔;S·K·艾瑟尔;M·弗里克内尔;J·克拉默;D·莫德哈;H·佩内尔;泽田润;B·S·塔巴 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06 |
代理公司: | 中国贸促会专利商标事务所有限公司 11038 | 代理人: | 郑宗玉 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 运行 重新 配置 神经网络 处理器 | ||
提供了硬件神经网络处理器。神经核包括权重存储器、激活存储器、向量‑矩阵乘法器和向量处理器。向量‑矩阵乘法器适于接收来自权重存储器的权重矩阵,接收来自激活存储器的激活向量,计算权重矩阵与激活向量的向量‑矩阵乘积。向量处理器适于从一个或多个向量源接收一个或多个输入向量,并且对一个或多个输入向量执行一个或多个向量函数以产生输出向量。在一些实施例中,可编程控制器适于配置和操作神经核。
技术领域
本公开的实施例涉及硬件神经网络处理器,尤其涉及运行时可重新配置的神经网络处理器核。
发明内容
根据本公开的实施例,提供了神经核。神经核包括权重存储器、激活存储器、向量-矩阵乘法器和向量处理器。向量-矩阵乘法器适于接收来自权重存储器的权重矩阵,接收来自激活存储器的激活向量,计算权重矩阵与激活向量的向量-矩阵乘积。向量处理器适于从一个或多个向量源接收一个或多个输入向量,并对一个或多个输入向量执行一个或多个向量函数以产生输出向量。在一些实施例中,可编程控制器适于配置和操作神经核。
附图说明
现在将参考附图仅通过举例来描述本发明的实施例,在附图中:
图1示出根据本公开的实施例的神经核。
图2示出根据本公开的实施例的推断处理单元所执行的逻辑操作。
图3示出根据本公开的实施例的神经核和相关联的网络。
图4A-B是根据本发明的实施例的示范性空间和过滤器内循环的核时序图。
图5是根据本公开的实施例的向量单元的详细视图。
图6示出根据本公开的实施例的用于配置神经核的方法。
图7示出根据本公开的实施例的用于配置神经核的方法。
图8描绘根据本公开的实施例的计算节点。
具体实施方式
人工神经元是数学函数,其输出是其输入的线性组合的非线性函数。如果一个神经元的输出是另一个神经元的输入,则连接两个神经元。权重是对一个神经元的输出与另一神经元的输入之间的连接强度进行编码的标量值。
神经元通过将非线性激活函数应用于其输入的加权和来计算其输出(称为激活)。加权和是通过将每个输入与对应的权重相乘并且累加乘积来计算的中间结果。部分和是输入的子集的加权和。所有输入的加权和可以通过累加一个或多个部分和来分阶段计算。
神经网络是一个或多个神经元的集合。神经网络通常被分成被称为层的神经元组。层是一个或多个神经元的集合,其全部从相同的层接收输入并且全部将输出发送到相同的层,并且通常执行类似的功能。输入层是从神经网络外部的源接收输入的层。输出层是将输出发送到神经网络之外的目标的层。所有其他层都是中间处理层。多层神经网络是具有多于一个层的神经网络。深度神经网络是具有许多层的多层神经网络。
张量是数值的多维阵列。张量块是张量中的元素的连续子阵列。
每个神经网络层与参数张量V、权重张量W、输入数据张量X、输出数据张量Y和中间数据张量Z相关联。参数张量包含控制层中的神经元激活函数的所有参数。权重张量包含将输入连接到该层的所有权重。输入数据张量包含该层用作输入的所有数据。输出数据张量包含该层作为输出计算的所有数据。中间数据张量包含该层作为中间计算产生的任何数据,诸如部分和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980036708.3/2.html,转载请声明来源钻瓜专利网。