[发明专利]一种可重构CNN高并发卷积加速器有效
申请号: | 201810497967.3 | 申请日: | 2018-05-21 |
公开(公告)号: | CN108805266B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 李丽;鲍贤亮;李宏炜;丰帆;李伟 | 申请(专利权)人: | 南京大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬;吴扬帆 |
地址: | 210046 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可重构 cnn 并发 卷积 加速器 | ||
1.一种可重构CNN高并发卷积加速器,其特征在于包括:
权重地址生成单元,生成卷积核数据在缓存中的地址;
结果地址生成单元,生成结果数据在缓存中的地址;
可重构计算单元,对应于两种卷积工作模式,可将计算阵列重构为两种不同粒度的乘累加树电路;
特征图地址生成单元,生成特征图数据在缓存中的地址;
主控制器,内部包含配置寄存器文件,根据配置的特征图大小、特征图通道数、卷积核大小、卷积核通道数、输出结果大小、输出结果通道数、卷积步幅以及卷积模式信息控制特征图地址生成单元、权重地址生成单元和结果地址生成单元,并生成与地址同步的累加器清零信号选通可重构计算单元中对应的两种不同粒度的乘累加树电路,产生整个运算结束的中断信号;
存储交换单元,将有效的特征图读地址、权重读地址转换为对存储单元的读操作,将有效的结果写地址和数据转换为对存储单元的写操作;特征图数据和卷积核数据通过专用的映射方式进行存储;所述可重构计算单元的两种工作模式分别为图像输入模式和普通卷积模式,分别对应于卷积神经网络中图像输入层和中间卷积层的卷积运算。
2.根据权利要求1所述的可重构CNN高并发卷积加速器,其特征在于,普通模式下乘累加树结构为64通道;图像输入模式下的乘累加树结构为16路4通道;两种工作模式下,特征图数据和卷积核数据在存储中的映射按照由高到低的优先级顺序依次为通道方向、行方向、列方向。
3.根据权利要求2所述的可重构CNN高并发卷积加速器,其特征在于,在普通卷积模式下,多通道特征图和多通道卷积核按64个通道组成一个数据块。
4.根据权利要求2所述的可重构CNN高并发卷积加速器,其特征在于,图像输入模式下三通道的卷积核补充一个通道的0形成四通道,16个卷积核组成一组。
5.根据权利要求2所述的可重构CNN高并发卷积加速器,其特征在于,单个可重构乘累加树单元将计算阵列中的乘法器和加法器进行重组和选通形成不同粒度的乘累加树电路,每个乘累加树将运算结果输出至一个累加器。
6.根据权利要求5所述的可重构CNN高并发卷积加速器,其特征在于,可重构计算单元里有8个可重构乘累加树结构,实现普通模式下8路卷积的并行运算或图像输入模式下128路卷积的并行运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810497967.3/1.html,转载请声明来源钻瓜专利网。