[发明专利]一种应用于CNN网络卷积层的高效存算系统及其运算方法在审
申请号: | 202010947798.6 | 申请日: | 2020-09-10 |
公开(公告)号: | CN112052941A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 李丽;陈铠;傅玉祥;宋文清;何国强;陈辉;何书专 | 申请(专利权)人: | 南京大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06F17/15;H04L29/08 |
代理公司: | 南京泰普专利代理事务所(普通合伙) 32360 | 代理人: | 张磊 |
地址: | 210023 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 cnn 网络 卷积 高效 系统 及其 运算 方法 | ||
1.一种应用于CNN网络卷积层的高效存算系统,其特征是包括如下模块:
用于缓存结果数据的数据缓存模块;
用于进行高并行全流水卷积运算,得到卷积运算结果的运算阵列;
用于读取数据缓存中的图像源数据并发送给所述运算阵列的源数据分发模块;
用于读取数据缓存中的权重数据,并将数据复制重新编组,发送给所述运算阵列的权重共享模块;
用于将运算阵列卷积计算结果存入所述数据缓存模块中的结果数据写入模块。
2.根据权利要求1所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述数据缓存模块进一步包括源数据缓存区、权重缓存区、结果缓存区,所述数据缓存模块提供与外设通信的读写接口;所述源数据缓存区用于存储图像源数据集,所述权重缓存区用于存储权重数据,所述结果缓存区用于缓存结果数据。
3.根据权利要求1所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述运算阵列包括n个相同的运算簇,其中n表示处理图像的并行度。
4.根据权利要求3所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述运算簇包括m个16位定点乘累加器,至少1个16位定点加法器,源数据共享模块、以及数据重排模块;其中m表示单个簇内的运算并行度。
5.根据权利要求4所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述运算阵列在进行卷积运算时的并行度为n×m;所述源数据共享模块进一步用于将至少1路输入数据,经至少1对m驱动器,将源数据复制m份,分发给m个乘累加器,其中m表示单个簇内的运算并行度。
6.根据权利要求4所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述数据重排模块进一步用于将同一时刻到达的m个乘累加器输出结果,经延迟单元和多路选择器MUX,复用至少1个输出端口,形成一路结果输出;其中m表示单个簇内的运算并行度。
7.根据权利要求3所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述运算簇包括m+1个权重输入和1个源数据输入端,通过内部互联形成m路并行流水运算结构,源数据经过源数据共享模块产生m个输出,分别送至m个乘累加器的第1输入端,权重1至权重m分别送至乘累加器1至乘累加器m的第2输入端,乘累加器1至乘累加器m同时运算,计算结果送至数据重排模块,数据重排模块的输出送至加法器的输入1,权重m+1送至加法器的输入2,加法器的输出结果作为运算簇的卷积运算结果;其中,n表示运算阵列处理图像的并行度,m表示单个簇内的运算并行度。
8.根据权利要求1所述的一种应用于CNN网络卷积层的高效存算系统,其特征在于,所述权重共享模块包括m+1个权重输入,每个权重经过1对n驱动器,复制n份,经多路选择器MUX,产生n组权重输出,每组权重包括权重1至权重m+1,n组权重分别送至n个运算簇;其中,n表示运算阵列处理图像的并行度,m表示单个簇内的运算并行度。
9.一种应用于CNN网络卷积层的高效存算系统的运算方法,其特征在于包括如下步骤:
步骤1、写源数据:通过源数据写入端口,将图像源数据存入数据缓存的源数据缓存区,将卷积运算所需的权重数据存入数据缓存的权重缓存区;
步骤2、数据传输:源数据分发模块产生读地址,从n个源数据BANK中读取不同图像的源数据,分别送往运算簇1-运算簇n;同时,权重共享模块产生读地址,从权重BANK1-权重BANKm中读取权重数据,形成n组同样的权重数据,分别送往运算簇1-运算簇n;
步骤3、卷积运算:各个运算簇按并行流水方式进行卷积运算,运算簇1-运算簇n并行进行n幅图像的卷积运算,每个运算簇内并行进行m个卷积核的卷积运算,总的卷积运算并行度达到n×m,每个运算簇产生输出图像通道维度上的m个结果点;
步骤4、结果缓存:结果数据写入接收n个运算簇的卷积运算结果即n幅图像卷积结果,存入数据缓存的结果缓存区;
步骤5、重复步骤2-步骤4,完成图像所有结果点卷积运算;
步骤6、读结果:通过结果数据读出端口,将图像卷积结果读出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010947798.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种补偿型电梯导轨固定夹
- 下一篇:一种建筑围护结构传热系数现场检测装置