[发明专利]一种基于并行快速FIR滤波器算法的卷积神经网络硬件加速器有效
申请号: | 201710151826.1 | 申请日: | 2017-03-10 |
公开(公告)号: | CN107633297B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王中风;王稷琛;林军 | 申请(专利权)人: | 南京风兴科技有限公司 |
主分类号: | G06N3/06 | 分类号: | G06N3/06;G06N3/063 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;许伟群 |
地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于并行快速FIR滤波器算法的卷积神经网络硬件加速器。本加速器主要由计算逻辑和存储单元两大部分构成,计算逻辑主要包含多用处理器,快速卷积单元以及由快速卷积单元构成的卷积计算阵列;存储单元包括像素存储器,权值缓存,附加存储器和片外动态存储器。本加速器可以在三个层面并行处理卷积神经网络的计算,分别是行(列)并行,层内并行和层间并行。由于本加速器可以适用在多种并行度的场合,所以可以非常高效地处理卷积神经网络的计算,并且能够达到可观的数据吞吐率。 | ||
搜索关键词: | 一种 基于 并行 快速 fir 滤波器 算法 卷积 神经网络 硬件 加速器 | ||
【主权项】:
一种基于并行快速FIR滤波器算法的卷积神经网络硬件加速器,包括:多用处理器,用于接收输入像素神经元,完成位宽转换、卷积、加法树、线性修正、最大池化等操作,并把结果存入相应的存储单元。像素存储器,用于存储部分输入图片及特征图片。权值缓存,用于缓存部分卷积核的权值。附加存储器,用于存储输入图片和特征图片卷积计算的中间结果。片外动态存储器,用于存储全部的卷积核权值和要处理的整幅输入图片。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风兴科技有限公司,未经南京风兴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710151826.1/,转载请声明来源钻瓜专利网。