[发明专利]一种基于FPGA的深度卷积神经网络的流水化加速系统有效
申请号: | 201710072223.2 | 申请日: | 2017-02-09 |
公开(公告)号: | CN106875012B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 李开;邹复好;章国良;黄浩;杨帆;孙浩 | 申请(专利权)人: | 武汉魅瞳科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 张英 |
地址: | 430074 湖北省武汉市洪山*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于FPGA的深度卷积神经网络的流水化加速系统,该流水化加速系统主要由输入数据分配控制模块、输出数据分配控制模块、卷积计算顺序序列化实现模块、池化计算顺序序列化实现模块、卷积计算模块、池化计算模块和卷积计算结果分配控制模块组成,此外所述流水化加速系统还包含一个内部系统级联接口。按照本发明设计的流水化加速系统,能够在FPGA上高效并行流水化实现,并且有效地解决了计算过程中由于各类填充操作而导致的资源浪费和有效计算延误问题,能有效地降低系统功耗和大大提高运算处理速度。 | ||
搜索关键词: | 一种 基于 fpga 深度 卷积 神经网络 流水 加速 系统 | ||
【主权项】:
1.一种基于FPGA的深度卷积神经网络的流水化加速系统,其特征在于,该系统包括:输入数据分配控制模块、输出数据分配控制模块、卷积计算顺序序列化实现模块、池化计算顺序序列化实现模块、卷积计算模块、池化计算模块和卷积计算结果分配控制模块,此外所述流水化加速系统还包含一个内部系统级联接口;所述输入数据分配控制模块同时与FPGA外围接口和所述内部系统级联接口、卷积计算顺序序列化实现模块相连;所述输出数据分配控制模块同时与FPGA外围接口和所述内部系统级联接口、卷积计算结果分配控制模块以及池化计算模块相连;所述卷积计算结果分配控制模块同时与所述卷积计算模块、输出数据分配控制模块以及池化计算顺序序列化实现模块相连;所述卷积计算顺序序列化实现模块与卷积计算模块之间直接相连;所述池化计算顺序序列化实现模块与池化计算模块之间直接相连;所述输入数据分配控制模块实时监视所述卷积计算顺序序列化实现模块的数据消耗状况,向DDR片外存储器发送相关读数据命令并及时接收FPGA外围接口和所述内部系统级联接口传送来的输入数据,除此之外,所述输入数据分配控制模块还需将接收到的数据传送给所述卷积计算顺序序列化实现模块;所述输出数据分配控制模块接收所述池化计算模块或所述卷积计算结果分配控制模块传送来的输入数据,并根据当前所处的计算阶段将接收到的数据传送给所述内部系统级联接口或所述FPGA外围接口,向所述DDR片外存储器发送相关写数据命令和相关中断通知;除此之外,所述输出数据分配控制模块还实时响应所述FPGA外围接口发送的命令;所述卷积计算顺序序列化实现模块结合调整参数将深度卷积神经网络中相关卷积操作的结构化计算顺序序列化,并为所述卷积计算模块及时传送序列化后的数据集;所述池化计算顺序序列化实现模块结合相关调整参数将深度卷积神经网络中相关池化操作的结构化计算顺序序列化,并为所述池化计算模块及时传送序列化后的数据集;所述卷积计算模块完成深度卷积神经网络中的相关卷积计算,并将计算结果及时传送给所述卷积计算结果分配控制模块;所述池化计算模块完成深度卷积神经网络中的相关池化操作,并将计算结果及时传送给所述输出数据分配控制模块;所述卷积计算结果分配控制模块接收所述卷积计算模块传来的计算结果数据,并根据当前所处的计算阶段将接收到的数据有组织有规格地传送给所述池化计算顺序序列化实现模块或所述输出数据分配控制模块;所述内部系统级联接口为所述FPGA片上系统内部子系统之间的级联或内部模块之间的连接提供有效接口,用于连接所述输出数据分配控制模块和输入数据分配控制模块。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉魅瞳科技有限公司,未经武汉魅瞳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710072223.2/,转载请声明来源钻瓜专利网。