[发明专利]一种适用于堆叠式沙漏网络的深度学习加速器有效
申请号: | 201910150398.X | 申请日: | 2019-02-28 |
公开(公告)号: | CN109993293B | 公开(公告)日: | 2021-04-13 |
发明(设计)人: | 栗涛;陈弟虎;梁东宝;萧嘉乐;叶灵昶 | 申请(专利权)人: | 中山大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08;G06N3/04 |
代理公司: | 广州新诺专利商标事务所有限公司 44100 | 代理人: | 张玲春 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种适用于堆叠式沙漏网络的深度学习加速器,并行计算的层计算单元提高了计算并行度,数据缓存模块在加快计算速度的同时提高了载入到加速器内部缓存的数据的利用率;同时加速器内部的数据调整器可以根据计算层操作的不同能够进行自适应的数据排布顺序的变化,能够增加获取数据的完整性,提高数据获取的效率,减少访存过程的延时。因此,本加速器在提高算法计算速度的同时通过减少内存访问次数及提高访存效率来有效地降低了内存带宽,从而实现加速器整体的计算加速性能。 | ||
搜索关键词: | 一种 适用于 堆叠 沙漏 网络 深度 学习 加速器 | ||
【主权项】:
1.一种适用于堆叠式沙漏网络的深度学习加速器,其特征在于,包括控制模块、数据计算模块和数据缓存模块;所述控制模块,连接至主控处理器,用于接收所述主控处理器输入的控制信号,根据所述控制信号控制所述数据计算模块和所述数据缓存模块;所述数据计算模块包括多个层计算单元;所述层计算单元用于执行堆叠式沙漏网络中的数据处理操作;所述层计算单元包括:数据调整器,用于根据预设的卷积信息对输入的图像处理数据进行重新排列;所述图像处理数据包括图像数据和权值数据;所述卷积信息包括卷积核大小和步长;乘法器,用于对重排后的所述图像处理数据按位进行并行的乘法操作;可配置级数的加法器,用于对所述数据调整器的输出结果和所述乘法器的输出结果执行累加操作;所述数据缓存模块,连接至系统内存,用于获取所述系统内存中的所述图像处理数据并传输至所述数据计算模块,或将所述层计算单元的输出结果进行缓存,或将所述输出结果输入至所述层计算单元进行计算。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910150398.X/,转载请声明来源钻瓜专利网。
- 上一篇:集成电路芯片装置及相关产品
- 下一篇:一种基于神经网络的FPGA