[发明专利]一种基于FPGA的二值神经网络加速方法及系统有效
申请号: | 201910636517.2 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110458279B | 公开(公告)日: | 2022-05-20 |
发明(设计)人: | 李开;邹复好;祁迪 | 申请(专利权)人: | 武汉魅瞳科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 武汉东喻专利代理事务所(普通合伙) 42224 | 代理人: | 李佑宏 |
地址: | 430073 湖北省武汉市东湖新技术*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于FPGA的二值神经网络加速系统,其利用FPGA形成的卷积核参数获取模块、二值化卷积神经网络结构和缓存模块,缓存模块为FPGA的片上内存,各模块通过获取待处理图片的输入特征图、获取卷积计算逻辑规则和相应的进行二值化卷积计算,FPGA依据卷积计算逻辑规则遍历多个线程的卷积计算,得到待处理图像的输出特征图数据,通过该整体架构将二值神经网络中各层的计算量全部卸载到片上内存,而不依赖片外内存与片上内存的交互,从而减少了存储器之间的通信成本,极大地提高了计算效率,提高了待检测图像的检测速度。 | ||
搜索关键词: | 一种 基于 fpga 神经网络 加速 方法 系统 | ||
【主权项】:
1.一种基于FPGA的二值神经网络加速系统,该系统包括利用FPGA形成的卷积核参数获取模块、二值化卷积神经网络结构和缓存模块,所述缓存模块为FPGA的片上内存,其特征在于,/n所述卷积核参数获取模块用于获取待处理图片的输入特征图,利用卷积神经网络模型在已有的数据集上进行二值化训练,得到卷积计算逻辑规则和多个卷积核参数,所述卷积计算逻辑规则包括多个线程的卷积计算;/n所述缓存模块用于调取所述卷积计算逻辑规则和多个卷积核参数,依据卷积计算逻辑规则将多个卷积核参数存储于FPGA的片上内存,缓存模块还用于缓存卷积基本计算模块的计算结果和待处理图片数据;/n所述二值化卷积神经网络结构用于调取卷积计算逻辑规则生成多个卷积基本计算模块,多个卷积基本计算模块依据卷积计算逻辑规则建立相应的连接关系,一个线程的卷积计算对应多个卷积基本计算模块,多个卷积核参数与多个卷积基本计算模块一一对应;/n所述卷积基本计算模块用于依据卷积计算逻辑规则,读取缓存模块中的当前线程的上一卷积基本计算模块的计算结果、当前滑动窗口内的待处理图像的输入特征图和FPGA的片上内存中的对应卷积核数据,依次进行预设的卷积计算顺序得到当前卷积基本计算模块的计算结果,并将当前卷积基本计算模块的计算结果存储于对应的缓存区;所述预设的卷积计算顺序为依次进行卷积、PRelu激活、正则归一化和二值激活计算,或者依次进行卷积、PRelu激活、池化、正则归一化和二值激活计算;/nFPGA依据卷积计算逻辑规则遍历多个线程的卷积计算,得到待处理图像的输出特征图数据,以提高待检测图像的检测速度。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉魅瞳科技有限公司,未经武汉魅瞳科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910636517.2/,转载请声明来源钻瓜专利网。