[发明专利]一种基于循环展开的卷积神经网络硬件加速器在审
申请号: | 201911013076.7 | 申请日: | 2019-10-23 |
公开(公告)号: | CN110807512A | 公开(公告)日: | 2020-02-18 |
发明(设计)人: | 郭阳;李艺煌;马胜;刘胜;陈小文;雷元武 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 展开 卷积 神经网络 硬件 加速器 | ||
1.一种基于循环展开的卷积神经网络硬件加速器,包括单通道数据流硬件结构,其特征在于,在所述单通道数据流硬件结构中,CSC缓冲器在不同的通道中将缓冲器互连,令它们可以实现移位;通过移位,让原本重用的数据放在下一次窗口滑动的位置。
2.根据权利要求1所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,所述CSC缓冲器中数据的存储采取一维的方式;依次按照通道、卷积图、行的顺序将本来是三维的数据展开成一维数据,依次存放在缓冲器中。
3.根据权利要求1或2所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,所述单通道数据流硬件结构中PE阵列由PE行构成,每个PE行由n个乘法器组成,总共有m个PE行,用来计算乘累加,随着数据流的流动得出最终的结果;所述CSC缓冲器将不同的神经元传递给PE阵列,并使用卷积图进行乘法和加法。
4.根据权利要求3所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,多个PE行组成PE阵列,激活值入口接收的数据相同;来自SB的权重数据是不一样的;最终PE阵列随着数据流的推进完成计算工作。
5.根据权利要求4所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,激活值通过Activation数据总线将对应的数据送入寄存器中,而另外一边通过SB也接收到数据;然后进行乘累加,在一个周期内完成计算。
6.根据权利要求4所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,所述单通道数据流硬件结构中采取每个PE行9个乘累加器的方式。
7.根据权利要求1或2所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,所述单通道数据流硬件结构中数据流并行n个卷积图的突触和神经元数据和m个输出通道;Activation in作为第一级缓冲器,用来存储当前层所有的神经元,CSC缓冲器作为第二级缓冲器承担两个功能,一是缓冲卷积图滑动上的神经元,第二个是承担和计算阵列的通信任务,是流水线时刻保持忙碌状态。
8.根据权利要求1或2所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,所述CSC缓冲器包含了n个缓冲器;每个缓冲器间还有互联,用于数据的重用。
9.根据权利要求8所述的基于循环展开的卷积神经网络硬件加速器,其特征在于,所述单通道数据流硬件结构中SB存储器负责存储当前卷积层的权重数据,然后配合CSC缓冲器送入阵列进行运算;所述SB存储器包含m*n个缓冲器,分为m组,每组负责缓冲一个权重内核数据;在每一个组内有n个缓冲器,每个缓冲器缓冲不同通道的突触;在每个时钟周期,CSC缓冲器向PE阵列输出的是一张卷积图的不同突触。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911013076.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:身份信息生成方法、装置及存储介质
- 下一篇:相似目标的检测模型生成方法及设备