[发明专利]使用多个深度学习加速器实施人工神经网络的计算在审
申请号: | 202180082761.4 | 申请日: | 2021-10-18 |
公开(公告)号: | CN116583853A | 公开(公告)日: | 2023-08-11 |
发明(设计)人: | J·卡明斯;M·维泰兹;E·库卢尔切洛;A·X·明·张;A·扎伊迪 | 申请(专利权)人: | 美光科技公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 任超 |
地址: | 美国爱*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 深度 学习 加速器 实施 人工 神经网络 计算 | ||
1.一种方法,其包括:
在计算设备中接收表示人工神经网络的描述的数据;
通过所述计算设备识别所述人工神经网络的多个部分;以及
通过所述计算设备根据表示所述人工神经网络的所述描述的所述数据生成配置成将分别在多个装置上执行的多个编译器输出,其中所述多个编译器输出能够在所述多个装置上执行以响应于到所述人工神经网络的输入而生成所述人工神经网络的输出。
2.根据权利要求1所述的方法,其进一步包括:
对于所述编译器输出中的每一个,生成表示所述人工神经网络的所述多个部分当中的相应部分的参数的第一数据和表示能够在所述多个装置当中的相应装置上执行的指令的第二数据。
3.根据权利要求2所述的方法,其进一步包括:
在多个所述装置上依序执行所述编译器输出的至少一部分。
4.根据权利要求3所述的方法,其进一步包括:
执行所述多个编译器输出中的第一编译器输出以生成所述人工神经网络中的中间结果,且指示执行所述第一编译器输出的第一装置将所述中间结果写入执行所述多个编译器输出中的第二编译器输出的第二装置的随机存取存储器中。
5.根据权利要求3所述的方法,其进一步包括:
执行所述多个编译器输出中的第一编译器输出以生成所述人工神经网络中的中间结果,且指示执行所述第一编译器输出的第一装置将所述中间结果的可用性告知所述多个装置中的一或多个第二装置。
6.根据权利要求5所述的方法,其进一步包括:
在所述一或多个第二装置上分别执行所述多个编译器输出中的一或多个编译器输出,以指示所述一或多个第二装置从所述第一装置的随机存取存储器读取所述中间结果。
7.根据权利要求2所述的方法,其进一步包括:
在生成所述人工神经网络的所述输出的同时在多个所述装置上执行所述编译器输出的至少一部分。
8.根据权利要求7所述的方法,其进一步包括:
选择所述人工神经网络的所述多个部分,以减少到所述人工神经网络的所述输入与所述人工神经网络的所述输出之间的等待时间。
9.根据权利要求7所述的方法,其进一步包括:
选择所述人工神经网络的所述多个部分当中的第一部分和所述多个部分当中的第二部分,以使所述人工神经网络中一组重叠的人工神经元减少到所述人工神经网络的所述输入与所述人工神经网络的所述输出之间的等待时间。
10.根据权利要求2所述的方法,其进一步包括:
将所述多个编译器输出分别写入所述多个装置中,以将所述多个装置配置成执行所述人工神经网络的矩阵计算。
11.一种计算设备,其包括:
存储器;以及
至少一个微处理器,其配置成:
接收表示人工神经网络的描述的数据;
识别所述人工神经网络的多个部分;以及
根据表示所述人工神经网络的所述描述的所述数据生成配置成将分别在多个装置上执行的多个编译器输出,其中所述多个编译器输出能够在所述多个装置上执行以响应于到所述人工神经网络的输入而生成所述人工神经网络的输出。
12.根据权利要求11所述的计算设备,其中所述多个装置中的每一相应装置具有随机存取存储器和配置成执行矩阵操作的至少一个处理单元;且所述多个编译器输出中的每一个包含表示所述人工神经网络的所述多个部分当中的相应部分的参数的第一数据和表示能够在所述多个装置当中的相应装置上执行的指令的第二数据。
13.根据权利要求12所述的计算设备,其进一步包括所述多个装置;且所述至少一个微处理器配置成将所述多个编译器输出分别写入所述多个装置中,以将所述多个装置配置成执行所述人工神经网络的矩阵计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美光科技公司,未经美光科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180082761.4/1.html,转载请声明来源钻瓜专利网。