[发明专利]用于神经网络硬件加速的多播网络和存储器转移优化有效

申请号：	201780040900.0	申请日：	2017-05-06
公开（公告）号：	CN109478252B	公开（公告）日：	2023-07-25
发明（设计）人：	J.布吕斯特勒;C.吴	申请（专利权）人：	英特尔公司
主分类号：	G06N3/063	分类号：	G06N3/063
代理公司：	中国专利代理(香港)有限公司 72001	代理人：	姜冰;张金金
地址：	美国加利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	用于神经网络硬件加速网络存储器转移优化
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种配置输入数据以用于向数据接收器多播的系统，包括：

计算机存储器，所述计算机存储器存储输入数据并且在已知地址中存储配置数据；

一组交换节点，所述一组交换节点被配置成多播网络，所述多播网络被安排成多层，每层具有多个交换节点，第一层紧邻所述输入数据并且最末层紧邻数据接收器，每个交换节点存储被包括在多个条目中的所接收的输入数据、配置指示符和控制器指示符，

所述配置指示符指定是否要执行广播模式，是否要根据所述配置数据来转发输入数据，或者执行通行模式，其中不管所述配置数据如何而转发输入数据，以及

所述控制器指示符指定是否要更新至少一个交换节点条目；以及

一组控制寄存器，所述一组控制寄存器可通信地连接到所述一组交换节点中的每个交换节点，这组寄存器被配置成存储所接收的配置数据，以便这组节点在两个操作内被配置，第一操作从所述计算机存储器中的所述已知地址读取所述配置数据，以及第二操作填充所述一组控制寄存器，以及随后的操作包括根据所填充的所述一组控制寄存器由所述一组交换节点进行的多播操作。

2.如权利要求1所述的系统，其中，所述数据接收器是一组执行单元。

3.如权利要求2所述的系统，包括：

第二组交换节点，所述第二组交换节点被配置成多播网络，所述多播网络被安排成多层，每层具有多个交换节点，第一层紧邻所述输入数据以及最末层紧邻接收数据的所述一组执行单元，所述第二组交换节点中的每个交换节点存储被包括在多个条目中的所接收的输入数据、配置指示符和控制器指示符，

所述控制器指示符指定是否要更新至少一个交换节点条目；以及

其中，所述第二组交换节点中的每个交换节点可通信地连接到所述控制寄存器。

4.如权利要求3所述的系统，其中，第一组交换节点的最末层以与所述第二组交换节点的最末层不同的置换连接到所述一组执行单元。

5.如权利要求4所述的系统，其中，所述第一组交换节点的最末层连接到所述一组执行单元所采用的置换是取模，以及所述第二组交换节点的最末层连接到所述一组执行单元所采用的置换是成群扇出。

6.如权利要求1所述的系统，其中，所述一组交换节点被配置成经由包含一系列的处理器指令的流水线来操作，其中，所述流水线中的第一处理器指令用于配置所述一组控制寄存器，所述流水线中的第二处理器指令用于为交换节点的所述第一层执行多播，以及每个随后的处理器指令用于为交换节点的每个相应的随后层执行多播，使得在所述流水线中的第一和第二处理器指令内可执行所述一组交换节点的所述配置。

7.如权利要求6所述的系统，其中，为交换节点的层执行多播的所述流水线中的所述处理器指令对于被配置成所述网络的所述交换节点的拓扑是特定的。

8.如权利要求6所述的系统，其中，所述流水线包含空操作以保证所述流水线在配置所述一组交换节点期间不会停转。

9.如权利要求1所述的系统，其中，所述一组交换节点被配置成将被设置成通行的所述配置指示符解释成经由包含一系列的处理器指令的流水线来操作，所述流水线中的第一处理器指令用于为交换节点的所述第一层执行多播，以及每个随后的处理器指令用于为交换节点的每个相应的随后层执行多播，使得在所述流水线中的所述第一处理器指令内可执行所述一组交换节点的所述配置。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于英特尔公司，未经英特尔公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201780040900.0/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]用于神经网络硬件加速的多播网络和存储器转移优化有效

专利文献下载