[发明专利]面向chiplet互连的神经网络芯片层切换映射方法有效
申请号: | 202211474491.4 | 申请日: | 2022-11-22 |
公开(公告)号: | CN115796249B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 张浩;任一帆;鞠春晖;林啸;李阳 | 申请(专利权)人: | 辉羲智能科技(上海)有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04 |
代理公司: | 上海恒慧知识产权代理事务所(特殊普通合伙) 31317 | 代理人: | 刘翠;张宁展 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 chiplet 互连 神经网络 芯片 切换 映射 方法 | ||
1.一种面向chiplet互连的神经网络芯片层切换映射方法,其特征在于,包括:
遍历神经网络芯片中的每一个层切换阶段,对于每一次层切换,基于所需映射的神经网络芯片的互连拓扑结构,提取所述神经网络芯片第l-1层到第l层的层切换通信数据流;
遍历所有可能的层切换通信数据流,计算层切换时片间通信量;
遍历所述神经网络芯片中的每一个层切换阶段,提取片间通信量最小时的层切换通信数据流所对应的层切换映射方案,完成神经网络芯片层切换映射。
2.根据权利要求1所述的面向chiplet互连的神经网络芯片层切换映射方法,其特征在于,所述提取所述神经网络芯片第l-1层到第l层的层切换通信数据流,包括:
所述神经网络芯片层映射片间并行度来源于P、PK和K三个维度,其中,P表示输出特征图的宽维度,K表示输出特征图通道维度,PK表示输出特征图的宽维度结合输出特征图通道维度;
基于所述神经网络芯片的互连拓扑结构和所述神经网络芯片层映射片间并行度约束,使得所述神经网络芯片层切换通信发生在片间;
基于所述神经网络芯片层映射片间并行度的3种配置,依据所述神经网络芯片第l-1层和第l层的并行度来源设置,得到9种所述神经网络芯片层切换通信数据流模式;
针对得到的9种所述层切换通信数据流模式,进行通信流量抽象,引入集合通信,将层切换通信数据流划分为unicast、all-gather、scatter、unicast+all-gather和scatter+all-gather五种类型,并针对划分的五种类型的所述通信数据流进行通信实现;其中,unicast表示单播,all-gather表示全搜集,scatter表示分散,unicast+all-gather表示单播加上全搜集,scatter+all-gather表示分散加上全搜集,得到五种类型的神经网络芯片第l-1层到第l层的层切换通信数据流。
3.根据权利要求2所述的面向chiplet互连的神经网络芯片层切换映射方法,其特征在于,所述计算层切换时片间通信量的方法,包括:
提取第l-1层的输出特征图尺寸和第l层的输入特征图尺寸信息;
基于第l-1层到第l层的层切换通信数据流,并结合所述通信数据流的五种类型的实现方法,得到所述通信数据流在神经网络芯片的片间拓扑结构上的实现路径与访存情况,从而计算出层切换时片间通信量。
4.一种面向chiplet互连的神经网络芯片层切换映射系统,其特征在于,包括:
通信数据流提取模块,该模块基于遍历神经网络芯片中的每一个层切换阶段,对于每一次层切换,基于所需映射的神经网络芯片的互连拓扑结构,提取所述神经网络芯片第l-1层到第l层的层切换通信数据流;
片间通信量获取模块,该模块用于遍历所有可能的层切换通信数据流,计算层切换时片间通信量;
映射方案获取模块,该模块用于遍历所述神经网络芯片中的每一个层切换阶段,提取片间通信量最小时的层切换通信数据流所对应的层切换映射方案。
5.一种终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时可用于执行权利要求1-4中任一项所述的方法。
6.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时可用于执行权利要求1-4中任一项所述的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辉羲智能科技(上海)有限公司,未经辉羲智能科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211474491.4/1.html,转载请声明来源钻瓜专利网。