[发明专利]二值权重卷积神经网络加速器的硬件架构及其计算流程有效
申请号: | 201710032864.5 | 申请日: | 2017-01-12 |
公开(公告)号: | CN106875011B | 公开(公告)日: | 2020-04-17 |
发明(设计)人: | 王中风;王逸致;林军 | 申请(专利权)人: | 南京风兴科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 210032 江苏省南京市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于二值权重卷积神经网络加速器的硬件架构及其计算流程。其中,硬件架构包含以下部分:三个双端片上静态随机存储器,分别用于缓存输入神经元以及一个卷积层的二值权重;四个卷积处理单元,能够根据计算流程控制其中的运算部件完成主要的卷积计算操作;一个特征映射累积单元以及一个卷积累加阵列,用于进一步处理卷积处理单元的运算结果,以得到最终正确的输出神经元的值。整个设计通过动态随机存储器接口与片外存储器交换数据。除了硬件架构以外,本发明还包含了一个对该硬件架构优化了的,以四行输入特征映射为一次完整计算单位的详细计算流程。本发明最大化的复用了输入数据,尽可能的消除了片外存储器的访问,能够有效降低进行深度二值卷积神经网络计算的功耗,且能够支持深层网络,是一种可用于视觉应用的嵌入式系统的合理方案。 | ||
搜索关键词: | 权重 卷积 神经网络 加速器 硬件 架构 及其 计算 流程 | ||
【主权项】:
一种二值权重卷积神经网络加速器的硬件架构及计算流程,其特征在于,硬件架构部分包括:11.两个用于存储卷积层输入的双端静态随机存储器,即输入神经元缓存器IMEM,其容量分别能够存储该网络每一层输入的所有通道中的2行,共计4行,此行数所针对的卷积核大小为3×3;12.一个用于保存二值权重卷积神经网络权重的静态随机存储器,即卷积核缓存器FMEM,其容量大小能够将任意一层卷积层的所有二值权重缓存下来,期中每个权重占用1比特;13.四个卷积处理单元,主要根据计算流程完成卷积处理计算;14.一个特征映射累加单元;15.一个卷积累加阵列。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京风兴科技有限公司,未经南京风兴科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710032864.5/,转载请声明来源钻瓜专利网。