[发明专利]一种深度卷积神经网络硬件加速器中的可伸缩的并行数据载入装置及其设计方法在审
申请号: | 201910269464.5 | 申请日: | 2019-04-04 |
公开(公告)号: | CN111797585A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 林森;何一波;李珏 | 申请(专利权)人: | 北京芯启科技有限公司 |
主分类号: | G06F30/392 | 分类号: | G06F30/392;G06N3/04;G06N3/063 |
代理公司: | 北京名华博信知识产权代理有限公司 11453 | 代理人: | 李冬梅;苗源 |
地址: | 100091 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 卷积 神经网络 硬件 加速器 中的 伸缩 并行 数据 载入 装置 及其 设计 方法 | ||
1.一种专用于深度卷积神经网络硬件并行加速器中的,可伸缩的并行数据载入装置,其特征包括:
并行输入寄存阵列,向并行加速计算单元阵列进行高带宽的数据输入;
并行输入数据访问引擎,对上述并行输入寄存阵列中的数据进行并行访问并连接并行寄存阵列的输出以及并行加速计算单元的输入。
2.根据权利要求1所述的并行输入寄存器阵列,其特征在于,对于输入缓存中存储的关于深度卷积神经网络算法层之前一隐含层所输出的特征图,该并行输入寄存阵列提供数据重排布的快速寄存区域,简化了输入数据排布的难度;该并行输入寄存阵列可以被反复访问,当其中的数据已经作废时,可重新从输入缓存中快速写入新的数据。
3.根据权利要求1-2所述的并行输入寄存器阵列的设计方法,其特征在于,其尺寸设计与并行计算单元阵列的例化尺寸相关,满足特定的设计公式。
4.根据权利要求1所述的并行输入数据访问引擎,其特征在于,包括:
对于并行输入寄存阵列中的数据进行区域化的并行访问,而不是串行的、全地址空间的随机访问;
对于并行输入寄存阵列中的区域数据进行编址,在区域内能够以一定规律反复访问,利用卷积神经网络算法层输入特征图的区域数据耦合性,提高输入数据的使用次数,降低了输入缓存需要输入的次数与数据带宽;
将并行输入寄存阵列区域中的数据固定、并行的输入硬件并行加速计算单元阵列,为其提供快速大吞吐率的输入数据。
5.根据权利要求1、4所述的并行输入数据访问引擎的设计方法,其特征在于,对并行输入寄存阵列中的区域进行编址访问,而不是全部阵列地址空间的访问;对硬件并行加速计算单元阵列为对应固定访问。该设计方法能够化简该硬件引擎模块中的硬件电路复杂度,降低面积和功耗。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京芯启科技有限公司,未经北京芯启科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910269464.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种快速面测多晶硅片反射率的方法
- 下一篇:一种语音识别的训练方法和装置