[发明专利]对于神经网络计算操作的动态精度在审
申请号: | 201810372891.1 | 申请日: | 2018-04-24 |
公开(公告)号: | CN108734650A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | S.雅哈吉达尔;A.科克;T.斯派斯曼;V.兰加纳坦;M.麦克弗森;B.温布;J.雷;R.巴里克;姚安邦;L.赫德;J.维斯特;A.阿普;D.金;F.陈;N.R.萨蒂什;N.G.冯博里斯;P.唐;T-H.林;X.陈;F.阿克巴里;K.辛哈;E.努尔维塔迪;N.斯利尼瓦萨;M.斯特里克兰 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06T1/40 | 分类号: | G06T1/40;G06T15/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜冰;张金金 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 低精度部件 高精度部件 计算引擎 指令 神经网络计算 接收指令 硬件逻辑 应用 | ||
1. 一种装置,包括:
计算引擎,包含高精度部件和低精度部件;以及
至少部分包括硬件逻辑的逻辑,用于:
在所述计算引擎中接收指令;
选择所述高精度部件或者所述低精度部件中的至少一个来执行所述指令;以及
将门控应用于所述高精度部件或者所述低精度部件中的至少一个以执行所述指令。
2.如权利要求1所述的装置,其中:
所述门控包括时钟门控。
3.如权利要求1所述的装置,其中:
所述门控包括功率门控。
4.一种装置,包括:
至少一个执行单元;
至少一个FPGA,通信地耦合到所述至少一个执行单元;以及
至少部分包括硬件逻辑的逻辑,用于:
确定对于工作负荷或线程中的至少一个的工作负荷要求;以及
基于选择将所述工作负荷或所述线程中的所述至少一个重新映射到所述FPGA。
5.如权利要求4所述的装置,其中:
所述至少一个FPGA被集成到所述至少一个执行单元中。
6.如权利要求4所述的装置,其中:
所述至少一个FPGA通过宽的低等待时间通信接口而被通信地耦合到所述至少一个执行单元。
7.如权利要求4所述的装置,其中:
低负荷操作被映射到所述至少一个FPGA。
8.如权利要求4所述的装置,还包括FPGA合成器,所述FPGA合成器包括至少部分包括硬件逻辑的逻辑,用于:
将所述低负荷操作转换成变成线程的上下文状态的一部分的位。
9.如权利要求8所述的装置,还包括线程调度器,所述线程调度器包括至少部分包括硬件逻辑的逻辑,用于:
在线程调度操作期间通过所述位来对所述至少一个FPGA进行编程。
10.一种装置,包括至少部分包括硬件逻辑的逻辑,用于:
跟踪神经网络操作的精度级数据、以及在模型特定寄存器中暴露所述精度级数据。
11.一种装置,包括:
低级训练流水线;
高级训练流水线;以及
至少部分包括硬件逻辑的逻辑,用于
向所述高级训练流水线传递在所述低级训练流水线中生成误差的训练信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810372891.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:神经网络训练机构
- 下一篇:图像拼接方法及其图像拼接装置