[发明专利]执行神经网络模型的PIM架构的数据布局优化在审
申请号: | 202110050930.8 | 申请日: | 2021-01-14 |
公开(公告)号: | CN113139648A | 公开(公告)日: | 2021-07-20 |
发明(设计)人: | 周铭轩;陈国洋;张伟丰 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06N3/08;G06F17/16;G06F17/15;G06F7/523;G06F3/06 |
代理公司: | 北京清源汇知识产权代理事务所(特殊普通合伙) 11644 | 代理人: | 冯德魁;张艳梅 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 执行 神经网络 模型 pim 架构 数据 布局 优化 | ||
1.一种在包含存储块组件的PIM使能设备上布置计算图的方法,包括:
将计算图的第一节点分配到存储块组件中的存储块的第一阵列的第一存储块上;以及,
将计算图的第二节点分配到存储块组件中的存储块的第二阵列的第二存储块上,其中,所述第一节点的输出数据用于提供给所述第二节点使用;
其中,所述存储块组件配置为支持经由所述存储块组件中的内部数据耦合从所述第一存储块到所述第二存储块的数据传输。
2.根据权利要求1的方法,进一步包括:
基于第一节点和第二节点之间的依赖关系,为第一节点分配第一层编号,为第二节点分配第二层编号,其中第二层编号大于第一层编号。
3.根据权利要求2所述的方法,其中,所述计算图还包括第三节点,所述第三节点的输出数据用于提供给所述第二节点使用,第三层编号被分配给该节点,并且
当第一层编号大于第三层编号时,通过将第一层编号增加1获得第二层编号;当第三层编号大于第一层编号时,通过将第三层编号增加1获得第二层编号。
4.根据权利要求1的方法,进一步包括:
将第二节点重新分配到存储块组件中的存储块的第三阵列的第三存储块上;
其中,所述存储块组件配置为支持通过由所述存储块组件的所有存储块共享的全局缓冲区从第一存储块到第三存储块的数据传输,并且
来自包括第二节点且被分配给存储块第二阵列的一个或多个节点的输出边的数目,大于来自包括第一节点且被分配给存储块第一阵列的一个或多个节点的输出边的数目。
5.根据权利要求1的方法,进一步包括:
基于向量折叠,确定用于在第一存储块上执行第一节点的数据布局,
其中,第一存储块包括布置成多行和多列的存储单元阵列。
6.根据权利要求5所述的方法,其中所述第一节点包括向量与矩阵之间的向量矩阵乘法运算,并且
其中,所述向量的第一元素与所述向量的第二元素布置在多个列之间的同一列中。
7.根据权利要求6所述的方法,其中所述向量的第一元素在多个列中的同一列中被多次复制。
8.一种用于在包含存储块组件的PIM使能设备上布置计算图的设备,包括:
存储一组指令集的存储器;以及
一个或多个处理器,配置为执行所述一组指令集以使设备执行:
将计算图的第一节点分配到存储块组件中的存储块的第一阵列的第一存储块上;以及,
将计算图的第二节点分配到存储块组件中的存储块的第二阵列的第二存储块上,其中,所述第一节点的输出数据用于提供给所述第二节点使用;
其中,所述存储块组件配置为支持经由所述存储块组件中的内部数据耦合从所述第一存储块到所述第二存储块的数据传输。
9.根据权利要求8所述的设备,其中所述一个或多个处理器被配置为执行所述指令集,以使所述设备进一步执行:
基于第一节点和第二节点之间的依赖关系,为第一节点分配第一层编号,为第二节点分配第二层编号,其中第二层编号大于第一层编号。
10.根据权利要求9所述的装置,其中,所述计算图还包括第三节点,所述第三节点的输出数据用于提供给所述第二节点使用,第三层编号被分配给该节点,并且
当第一层编号大于第三层编号时,通过将第一层编号增加1获得第二层编号;当第三层编号大于第一层编号时,通过将第三层编号增加1获得第二层编号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110050930.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种鲁棒性共轭对称光学元件及其设计方法
- 下一篇:层叠陶瓷电容器