[发明专利]用于神经网络硬件加速的多播网络和存储器转移优化有效
申请号: | 201780040900.0 | 申请日: | 2017-05-06 |
公开(公告)号: | CN109478252B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | J.布吕斯特勒;C.吴 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜冰;张金金 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 神经网络 硬件加速 网络 存储器 转移 优化 | ||
1.一种配置输入数据以用于向数据接收器多播的系统,包括:
计算机存储器,所述计算机存储器存储输入数据并且在已知地址中存储配置数据;
一组交换节点,所述一组交换节点被配置成多播网络,所述多播网络被安排成多层,每层具有多个交换节点,第一层紧邻所述输入数据并且最末层紧邻数据接收器,每个交换节点存储被包括在多个条目中的所接收的输入数据、配置指示符和控制器指示符,
所述配置指示符指定是否要执行广播模式,是否要根据所述配置数据来转发输入数据,或者执行通行模式,其中不管所述配置数据如何而转发输入数据,以及
所述控制器指示符指定是否要更新至少一个交换节点条目;以及
一组控制寄存器,所述一组控制寄存器可通信地连接到所述一组交换节点中的每个交换节点,这组寄存器被配置成存储所接收的配置数据,以便这组节点在两个操作内被配置,第一操作从所述计算机存储器中的所述已知地址读取所述配置数据,以及第二操作填充所述一组控制寄存器,以及随后的操作包括根据所填充的所述一组控制寄存器由所述一组交换节点进行的多播操作。
2.如权利要求1所述的系统,其中,所述数据接收器是一组执行单元。
3.如权利要求2所述的系统,包括:
第二组交换节点,所述第二组交换节点被配置成多播网络,所述多播网络被安排成多层,每层具有多个交换节点,第一层紧邻所述输入数据以及最末层紧邻接收数据的所述一组执行单元,所述第二组交换节点中的每个交换节点存储被包括在多个条目中的所接收的输入数据、配置指示符和控制器指示符,
所述配置指示符指定是否要执行广播模式,是否要根据所述配置数据来转发输入数据,或者执行通行模式,其中不管所述配置数据如何而转发输入数据,以及
所述控制器指示符指定是否要更新至少一个交换节点条目;以及
其中,所述第二组交换节点中的每个交换节点可通信地连接到所述控制寄存器。
4.如权利要求3所述的系统,其中,第一组交换节点的最末层以与所述第二组交换节点的最末层不同的置换连接到所述一组执行单元。
5.如权利要求4所述的系统,其中,所述第一组交换节点的最末层连接到所述一组执行单元所采用的置换是取模,以及所述第二组交换节点的最末层连接到所述一组执行单元所采用的置换是成群扇出。
6.如权利要求1所述的系统,其中,所述一组交换节点被配置成经由包含一系列的处理器指令的流水线来操作,其中,所述流水线中的第一处理器指令用于配置所述一组控制寄存器,所述流水线中的第二处理器指令用于为交换节点的所述第一层执行多播,以及每个随后的处理器指令用于为交换节点的每个相应的随后层执行多播,使得在所述流水线中的第一和第二处理器指令内可执行所述一组交换节点的所述配置。
7.如权利要求6所述的系统,其中,为交换节点的层执行多播的所述流水线中的所述处理器指令对于被配置成所述网络的所述交换节点的拓扑是特定的。
8.如权利要求6所述的系统,其中,所述流水线包含空操作以保证所述流水线在配置所述一组交换节点期间不会停转。
9.如权利要求1所述的系统,其中,所述一组交换节点被配置成将被设置成通行的所述配置指示符解释成经由包含一系列的处理器指令的流水线来操作,所述流水线中的第一处理器指令用于为交换节点的所述第一层执行多播,以及每个随后的处理器指令用于为交换节点的每个相应的随后层执行多播,使得在所述流水线中的所述第一处理器指令内可执行所述一组交换节点的所述配置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780040900.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:处理方法及加速装置
- 下一篇:使用合成梯度来训练神经网络