[发明专利]一种深度卷积神经网络硬件加速器中的区域并行数据载入装置及方法在审

申请号：	201910979031.9	申请日：	2019-10-15
公开（公告）号：	CN110766150A	公开（公告）日：	2020-02-07
发明（设计）人：	杨旭光;林森;伍世聪	申请（专利权）人：	北京芯启科技有限公司
主分类号：	G06N3/063	分类号：	G06N3/063
代理公司：	11453 北京名华博信知识产权代理有限公司	代理人：	李冬梅
地址：	100091 北京市海淀区上地***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	区域化输入寄存并行并行输入数据并行访问并行数据并行硬件单元阵列电路设计连接电路输入缓存输入特征数据重排载入装置装置设计高带宽寄存功耗卷积引擎访问
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种深度卷积神经网络硬件并行加速器中的区域并行数据载入装置，其特征包括：

并行输入寄存阵列，为输入缓存中的输入特征图提供数据重排布的快速寄存区域，所寄存的数据将作为并行加速计算单元阵列进行高带宽计算的输入数据，可供随机访问或同时并行、并发的多路访问；

并行输入数据访问引擎，对上述并行输入寄存阵列中的数据进行区域化的并行、并发访问，无需对上述寄存阵列进行整体访问，也不会造成任何数据缺失。

2.根据权利要求1所述的并行输入寄存器阵列，其特征在于，对于输入缓存中存储的关于深度卷积神经网络算法层之前一隐含层所输出的特征图，该并行输入寄存阵列提供数据重排布的快速寄存区域，简化了输入数据排布的难度；该并行输入寄存阵列可以被反复访问，当其中的数据已经作废时，可重新从输入缓存中快速写入新的数据；该寄存阵列支持随机访问、同时并行访问和多路并发访问，并发的路数不小于深度卷积神经网络硬件并行加速器其中的并行加速计算单元的数量。

3.根据权利要求1-2所述的并行输入寄存器阵列的设计方法，其特征在于，其尺寸设计与并行计算单元阵列的例化尺寸相关，满足特定的设计公式。

4.根据权利要求1所述的并行输入数据访问引擎，其特征在于，包括：

对于并行输入寄存阵列中的数据进行区域化的并行、并发访问，既不是串行访问、也不是全地址空间的随机访问，并发的访问路数也不小于深度卷积神经网络硬件并行加速器其中的并行加速计算单元的数量；

对于并行输入寄存阵列中的区域数据以一定规律反复访问，这样可以在该数据区域内发挥卷积神经网络算法层输入特征图的区域数据耦合特性，无须再对并行输入寄存阵列反复大量写入重复的数据。

5.根据权利要求1、4所述的并行输入数据访问引擎的设计方法，其特征在于，对并行输入寄存阵列中的区域进行区域化的并行、并发访问，既不是串行访问、也不是全地址空间的随机访问；对于同时并发的多路访问，其地址计算遵循特定的计算规律，变换规律简单。该设计方法能够化简该硬件引擎模块中的硬件电路复杂度，降低面积和功耗。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京芯启科技有限公司，未经北京芯启科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910979031.9/1.html，转载请声明来源钻瓜专利网。

上一篇：放电速率依赖可塑性结构及实现方法
下一篇：一种基于场景的开放式神经网络模型管理系统

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种深度卷积神经网络硬件加速器中的区域并行数据载入装置及方法在审

专利文献下载