[发明专利]有效地将神经网络映射到可编程逻辑设备的系统和方法在审
申请号: | 201980067387.3 | 申请日: | 2019-10-09 |
公开(公告)号: | CN112840328A | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 陈国洋;张伟丰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06F12/0802 | 分类号: | G06F12/0802 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 有效地 神经网络 映射 可编程 逻辑 设备 系统 方法 | ||
1.一种用于将神经网络映射到可编程逻辑设备(PLD)的系统,包括:
至少一个存储器,所述存储器被配置为存储指令;和
至少一个处理器,所述处理器被配置为执行所述指令以使所述系统执行操作,包括:
接收定义所述PLD架构的数据结构;
接收定义所述神经网络架构的数据结构;
将所述PLD架构划分为多个层,每一层具有与第一片外缓冲器相邻的起始原语和与第二片外缓冲器相邻的结束原语;
将所述神经网络架构映射到多个层中的一层或多层上;
调度所述被映射的神经网络架构以在所述多个层中的一层或多层上执行;和
根据所述被调度和映射的神经网络架构输出执行序列。
2.根据权利要求1所述的系统,其中,定义所述神经网络架构的所述数据结构包括计算图。
3.根据权利要求2所述的系统,其中,所述计算图包括多个原语和对其的输入。
4.根据权利要求2或3所述的系统,其中,所述操作还包括:根据一个或多个变换规则,将包括一个或多个原语的至少一个子图变换为至少一个其他子图。
5.根据权利要求2-4中的任一项所述的系统,其中,所述计算图包括至少一个嵌套模式。
6.根据权利要求1-5中的任一项所述的系统,其中,定义所述PLD架构的所述数据结构包括规范语言。
7.根据权利要求1-6中任一项所述的系统,其中划分所述PLD架构包括应用Dijkstra的算法。
8.根据权利要求1至7中的任一项所述的系统,其中,划分所述PLD架构包括:沿着所述PLD的原语生成可能的路径,所述可能的路径的起始和结束与在片外传输数据的总线相邻,每条路径包括所述多个层中的一层。
9.根据权利要求1至8中任一项所述的系统,其中将所述神经网络架构映射到所述多个层中的一层或多层包括生成所述神经网络的原语的可能的映射到所述多个层上,并选择具有数据传输大小局部最小化的可能的映射。
10.根据权利要求1至9中任一项所述的系统,其中调度所述映射的神经网络架构以供执行包括:为所述多个层中的一层或多层选择执行顺序,以使得所述数据传输大小至少局部地最小化。
11.根据权利要求10所述的系统,其中,选择所述执行顺序包括:生成所述多个层中的一层或多层的可能的执行顺序,以及选择具有所述数据传输大小局部最小化的可能的执行顺序。
12.根据权利要求10或11所述的系统,其中,选择所述执行顺序包括应用贪婪算法。
13.根据权利要求10至12中任一项所述的系统,其中所述执行顺序的至少一个步骤包括对片外存储器的部分写入和对片内存储器的部分写入。
14.根据权利要求1至13中的任一项所述的系统,其中,所述执行顺序包括用于输入到所述PLD的比特流。
15.根据权利要求1至14中任一项所述的系统,其中,所述PLD包括现场可编程门阵列(FPGA)。
16.一种用于将神经网络映射到可编程逻辑设备(PLD)的方法,包括:
接收定义所述PLD架构的数据结构;
接收定义所述神经网络架构的数据结构;
将所述PLD架构划分为多个层,每一层具有与第一片外缓冲器相邻的起始原语和与第二片外缓冲器相邻的结束原语;
将所述神经网络的架构映射到多个层中的一层或多层上;
调度所述被映射的神经网络架构以在多个层中的一层或多层上执行;和
根据所述被调度和映射的神经网络架构输出执行序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980067387.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于染色的过程记录载玻片及其使用方法
- 下一篇:包含泡沫促进硅酮的清洁组合物