[发明专利]一种面向多核忆阻器存算一体平台的卷积算子映射方法在审
申请号: | 202210104656.2 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114418072A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 绳伟光;邓博;李忻默;景乃锋;王琴;蒋剑飞;贺光辉;毛志刚 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G11C13/00 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 多核 忆阻器存算 一体 平台 卷积 算子 映射 方法 | ||
1.一种面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,包括以下步骤:
步骤1、将卷积层的权重W[OC][IC][KH][KW]展开成一个权重矩阵W[IC×KH×KW][OC],每一行的所有权重都可以跟同一个输入并行相乘,输出按列并行得到,每一列上的输出是[IC×KH×KW]个权重分别与对应输入做乘累加得到的结果,即每一列都是一个卷积核,共有OC个卷积核;
步骤2、按忆阻器阵列的尺寸xbar_size对所述步骤1所得到的矩阵的行列进行分割,所得到的矩阵用P来表示,P中每一个元素都代表了一个大小的忆阻器阵列,P[i][j]表示第i行第j列忆阻器阵列所属的core ID;
步骤3、针对矩阵P完成映射。
2.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述多核忆阻器存算一体平台从顶至下分别Core级和Crossbar级。
3.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述多核忆阻器存算一体平台多个Core通过总线共享一块全局内存。
4.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述Core包括取指译码模块、载入模块、存储模块和计算模块。
5.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述Core包括数据存储器。
6.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述Core上的Crossbar单元和张量ALU是核心计算单元。
7.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述步骤3采用贪心策略。
8.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述卷积算子与Core外部存储器的通信开销为:
Target=rd_factor(P)+sync_facotr(P)
其中,读写代价rd_factor(P),是Core直接读写外部存储器获取输入数据产生的;同步代价sync_facotr(P),是Core间通过外部存储器传递数据所产生的。
9.如权利要求1所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述卷积算子与Core外部存储器的通信开销为:
其中,卷积运算输入为特征图In,权重W,步长stride,输出特征图为Out[B][OC][OH][OW];N为P矩阵列的数量,diffrow(corei)表示corei在矩阵P中位于不同行的元素数量,diffcol(corei)表示corei在矩阵P中位于不同列的元素数量;reuse(corei,stride)表示在矩阵P中,卷积步长为stride时,输入数据可复用的忆阻器阵列数量,L为参与映射的核心数。
10.如权利要求8或9所述的面向多核忆阻器存算一体平台的卷积算子映射方法,其特征在于,所述步骤3,每个Core上具有X个忆阻器阵列,首先确定映射权重W所需的Core的数量K,然后将P阵列所有元素都初始化为K,即在逻辑上先将所有阵列分配给核心K,接着遍历整个矩阵P,计算将元素分配给当前待分配Core或相邻Core时的Target,选择最小的方案,对未分配的元素重复这一过程,直到分配给Core K的元素数量不大于X。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210104656.2/1.html,转载请声明来源钻瓜专利网。