[发明专利]一种基于FPGA的深度卷积神经网络的流水化加速系统有效
申请号: | 201710072223.2 | 申请日: | 2017-02-09 |
公开(公告)号: | CN106875012B | 公开(公告)日: | 2019-09-20 |
发明(设计)人: | 李开;邹复好;章国良;黄浩;杨帆;孙浩 | 申请(专利权)人: | 武汉魅瞳科技有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/08 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 张英 |
地址: | 430074 湖北省武汉市洪山*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 fpga 深度 卷积 神经网络 流水 加速 系统 | ||
1.一种基于FPGA的深度卷积神经网络的流水化加速系统,其特征在于,该系统包括:
输入数据分配控制模块、输出数据分配控制模块、卷积计算顺序序列化实现模块、池化计算顺序序列化实现模块、卷积计算模块、池化计算模块和卷积计算结果分配控制模块,此外所述流水化加速系统还包含一个内部系统级联接口;
所述输入数据分配控制模块同时与FPGA外围接口和所述内部系统级联接口、卷积计算顺序序列化实现模块相连;所述输出数据分配控制模块同时与FPGA外围接口和所述内部系统级联接口、卷积计算结果分配控制模块以及池化计算模块相连;所述卷积计算结果分配控制模块同时与所述卷积计算模块、输出数据分配控制模块以及池化计算顺序序列化实现模块相连;所述卷积计算顺序序列化实现模块与卷积计算模块之间直接相连;所述池化计算顺序序列化实现模块与池化计算模块之间直接相连;
所述输入数据分配控制模块实时监视所述卷积计算顺序序列化实现模块的数据消耗状况,向DDR片外存储器发送相关读数据命令并及时接收FPGA外围接口和所述内部系统级联接口传送来的输入数据,除此之外,所述输入数据分配控制模块还需将接收到的数据传送给所述卷积计算顺序序列化实现模块;
所述输出数据分配控制模块接收所述池化计算模块或所述卷积计算结果分配控制模块传送来的输入数据,并根据当前所处的计算阶段将接收到的数据传送给所述内部系统级联接口或所述FPGA外围接口,向所述DDR片外存储器发送相关写数据命令和相关中断通知;除此之外,所述输出数据分配控制模块还实时响应所述FPGA外围接口发送的命令;
所述卷积计算顺序序列化实现模块结合调整参数将深度卷积神经网络中相关卷积操作的结构化计算顺序序列化,并为所述卷积计算模块及时传送序列化后的数据集;所述池化计算顺序序列化实现模块结合相关调整参数将深度卷积神经网络中相关池化操作的结构化计算顺序序列化,并为所述池化计算模块及时传送序列化后的数据集;
所述卷积计算模块完成深度卷积神经网络中的相关卷积计算,并将计算结果及时传送给所述卷积计算结果分配控制模块;所述池化计算模块完成深度卷积神经网络中的相关池化操作,并将计算结果及时传送给所述输出数据分配控制模块;
所述卷积计算结果分配控制模块接收所述卷积计算模块传来的计算结果数据,并根据当前所处的计算阶段将接收到的数据有组织有规格地传送给所述池化计算顺序序列化实现模块或所述输出数据分配控制模块;
所述内部系统级联接口为所述FPGA片上系统内部子系统之间的级联或内部模块之间的连接提供有效接口,用于连接所述输出数据分配控制模块和输入数据分配控制模块。
2.如权利要求1所述的基于FPGA的深度卷积神经网络的流水化加速系统,其特征在于,
所述卷积计算顺序序列化实现模块由特征图元组选择功能子模块和卷积核参数选择功能子模块组成,特征图元组选择功能子模块实现特征图元组选择功能,卷积核参数选择功能子模块实现卷积核参数选择功能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉魅瞳科技有限公司,未经武汉魅瞳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710072223.2/1.html,转载请声明来源钻瓜专利网。