[发明专利]一种实现卷积神经网络前向计算的硬件结构在审
申请号: | 201710119915.8 | 申请日: | 2017-03-01 |
公开(公告)号: | CN107066239A | 公开(公告)日: | 2017-08-18 |
发明(设计)人: | 曹伟;黄峰;孙亚洲;杨贤;王伶俐;周学功;李慧敏;范锡添;焦黎 | 申请(专利权)人: | 智擎信息系统(上海)有限公司 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06F9/30;G06N3/06 |
代理公司: | 上海百一领御专利代理事务所(普通合伙)31243 | 代理人: | 甘章乖,鄂艳涛 |
地址: | 201203 上海市浦东新区中国(上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 实现 卷积 神经网络 计算 硬件 结构 | ||
1.一种实现卷积神经网络前向计算的硬件结构,其特征在于,包括:
数据片外缓存模块,用于将外部输入的各张待处理图片中的参数数据缓存在该模块中,等待被多级流水线加速模块读取出来;
多级流水线加速模块,与所述数据片外缓存模块连接,用于从数据片外缓存模块中读取参数,实现卷积神经网络的核心计算;
参数读取仲裁模块,与所述多级流水线加速模块连接,用于处理多级流水线加速模块中多个读取参数请求,使多级流水线加速模块获取需要的参数;
参数片外缓存模块,与所述参数读取仲裁模块连接,用于存储卷积神经网络前向计算所需要的参数。
2.根据权利要求1所述的实现卷积神经网络前向计算的硬件结构,其特征在于,所述多级流水线加速模块由多级流水线构成,每一级流水线包括:
计算模块,用于实现卷积神经网络每层中的运算;
乒乓缓存结构模块,用于缓存与相邻流水线级之间的数据。
3.根据权利要求2所述的实现卷积神经网络前向计算的硬件结构,其特征在于,所述计算模块,还用于根据卷积神经网络结构中不同层的运算量,给不同的流水线级分配不同数量的硬件资源。
4.根据权利要求2所述的实现卷积神经网络前向计算的硬件结构,其特征在于,所述计算模块,采用三个维度的并行,分别是:多张特征图并行输入、多张特征图并行输出、卷积核中多个像素点并行计算。
5.根据权利要求2所述的实现卷积神经网络前向计算的硬件结构,其特征在于,所述计算模块,采用基于批处理的Batch-based的计算方式,将多张图片作为一个批处理并行同时计算。
6.根据权利要求2所述的实现卷积神经网络前向计算的硬件结构,其特征在于,所述乒乓缓存结构模块,包括两个片上缓存结构单元。
7.根据权利要求1所述的实现卷积神经网络前向计算的硬件结构,其特征在于,所述参数读取仲裁模块,采用轮循机制的仲裁方式,轮循响应从各级流水线加速模块发来的读取参数请求。
8.根据权利要求1所述的实现卷积神经网络前向计算的硬件结构,其特征在于,该硬件结构采用现场可编程门阵列FPGA芯片或专用集成电路ASIC芯片实现。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于智擎信息系统(上海)有限公司,未经智擎信息系统(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710119915.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:半导体设备及其操作方法
- 下一篇:功耗控制电路、电器设备及功耗控制方法