[发明专利]用于神经网络硬件加速的多播网络和存储器转移优化有效
申请号: | 201780040900.0 | 申请日: | 2017-05-06 |
公开(公告)号: | CN109478252B | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | J.布吕斯特勒;C.吴 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜冰;张金金 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 公开了神经网络特定的硬件加速优化,包含以恒量或线性时间执行的优化的DRAM转移单元和优化的多播网络。多播网络是被组织成层并且被配置成作为Beneš网络来操作的一组交换节点。网络中的所有交换节点可访问配置数据。在计算机指令内,每层被配置成执行前一层的Beneš网络转换。因为计算机指令被流水线化,可以恒量或线性时间配置交换节点的整个网络。类似地,被配置成按跨距访问存储器的DRAM转移单元将存储器组织成由质数或互质数的量来索引的存储体。索引值被挑选成不会引起存储器地址冲突。一旦接收到存储器规格,DRAM转移单元可算出跨距,从而以恒量或线性时间访问张量的整个平铺。 | ||
搜索关键词: | 用于 神经网络 硬件加速 网络 存储器 转移 优化 | ||
【主权项】:
1.一种配置输入数据以用于向数据接收器多播的系统,包括:计算机存储器,所述计算机存储器存储输入数据并且在已知地址中存储配置数据;一组交换节点,所述一组交换节点被配置成Beneš多播网络,所述多播网络被安排成多层,每层具有多个交换节点,第一层紧邻所述输入数据并且最末层紧邻数据接收器,每个交换节点存储被包括在多个条目中的所接收的输入数据、配置指示符和控制器指示符,所述配置指示符指定是否要执行广播模式,是否要根据所述配置数据来转发输入数据,或者执行通行模式,其中不管所述配置数据如何而转发输入数据,以及所述控制器指示符指定是否要更新至少一个交换节点条目;以及一组控制寄存器,所述一组控制寄存器可通信地连接到所述一组交换节点中的每个交换节点,这组寄存器被配置成存储所接收的配置数据,以便这组节点在两个操作内被配置,第一操作从所述计算机存储器中的所述已知地址读取所述配置数据,以及第二操作填充所述一组控制寄存器,以及随后的操作包括根据所填充的所述一组控制寄存器由所述一组交换节点进行的多播操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201780040900.0/,转载请声明来源钻瓜专利网。
- 上一篇:处理方法及加速装置
- 下一篇:使用合成梯度来训练神经网络