[发明专利]一种卷积神经网络CNN硬件加速器及加速方法有效
申请号: | 201710898502.4 | 申请日: | 2017-09-28 |
公开(公告)号: | CN107657581B | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 刘胜;郭阳;陈胜刚;万江华;雷元武;谭弘兵;宋蕊;曾国钊 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06T1/20 | 分类号: | G06T1/20;G06N3/063 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清;胡君 |
地址: | 410073 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种卷积神经网络CNN硬件加速器及加速方法,该加速器包括用于缓存输入特征图片数据的输入缓冲以及分别共用相同输入特征图片数据进行CNN卷积运算的多个运算单元,每个运算单元包括卷积核缓冲、输出缓冲以及由多个MAC部件构成的乘加单元,卷积核缓冲接收从外部存储部件返回的卷积核数据,分别提供给乘加单元中各个MAC部件,各个MAC部件分别接收输入特征图片数据、卷积核数据进行乘累加运算,运算的中间结果写入输出缓冲中;该加速方法为利用上述加速器的方法。本发明能够提高CNN硬件加速性能,且具有数据重用率及效率高、数据搬移量少、可扩展性能好,以及系统所需带宽、硬件开销小等优点。 | ||
搜索关键词: | 一种 卷积 神经网络 cnn 硬件 加速器 加速 方法 | ||
【主权项】:
一种卷积神经网络CNN硬件加速器,其特征在于:包括用于缓存输入特征图片数据的输入缓冲(1)以及分别共用相同输入特征图片数据进行CNN卷积运算的多个运算单元(2),每个所述运算单元(2)包括卷积核缓冲(21)、输出缓冲(22)以及由多个MAC部件(231)构成的乘加单元(23),所述卷积核缓冲(21)接收从外部存储部件返回的卷积核数据,分别提供给所述乘加单元(23)中各个所述MAC部件(231),各个所述MAC部件(231)分别接收所述输入特征图片数据、所述卷积核数据进行乘累加运算,运算的中间结果写入所述输出缓冲(22)中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710898502.4/,转载请声明来源钻瓜专利网。
- 上一篇:水泥混凝土路面分层病害修补结构
- 下一篇:一种基层冷再生路面结构