[发明专利]卷积神经网络加速计算方法、计算系统、芯片及接收机有效
申请号: | 202210054125.7 | 申请日: | 2022-01-18 |
公开(公告)号: | CN114254740B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 翁秀梅;朱佳;傅东;杨兆龙;郝志杰;丁杰 | 申请(专利权)人: | 长沙金维信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 长沙永星专利商标事务所(普通合伙) 43001 | 代理人: | 周咏;米中业 |
地址: | 410000 湖南省长沙市高新开发*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 加速 计算方法 计算 系统 芯片 接收机 | ||
本发明公开了一种卷积神经网络加速计算方法,包括读取偏置量;读取权重值;读取输入特征图的数据;对权重值下发更新指令;权重值更新完成后对读取的输入特征图进行计算;当前块计算完成后对计算结果进行缓存;重复上述步骤直至所有点计算完成,当前层卷积计算完成。本发明还公开了一种实现所述卷积神经网络加速计算方法的计算系统,以及包括了所述卷积神经网络加速计算方法或计算系统的芯片,以及包括了所述的卷积神经网络加速计算方法,或者包括了所述的计算系统,或者包括了所述的芯片的接收机。本发明通过创新的卷积计算加快算法的设计,不仅实现了卷积计算过程的加速,而且可靠性更高、实用性更好,功耗更少。
技术领域
本发明属于数据信号处理领域,具体涉及一种卷积神经网络加速计算方法、计算系统、芯片及接收机。
背景技术
近年来,随着经济技术的发展,人工智能技术已经广泛应用于人们的生产和生活当中,给人们的生产和生活带来了无尽的便利。
卷积神经网络(CNN)是人工智能技术的重要组成部分,也已经广泛应用到图像分类、目标检测、视频处理等领域。然而随着深度学习的进步,卷积神经网络层数越来越多,分类精度越来越高,卷积神经网络的计算量越来越大,参数也越来越多。因此,在实际工程应用中,越来越多的人选择低成本、低功耗的ASIC\FPGA进行卷积神经网络的计算加速。
然而,大多数的ASIC\FPGA加速器均存在如下主要问题:(1)专用性比较强,只能适配某些网络模型:拿卷积算子举例,部分ASIC\FPGA加速器可能只能支持特定的卷积核大小,如3*3、1*1等;(2)计算时采用单一的数据复用方式或复用输入特征图,或复用权重,因此需要反复读取外部存储,对带宽依赖大,而且算法的功耗高。
发明内容
本发明的目的在于提供一种可靠性高、实用性好且功耗较低的卷积神经网络加速计算方法。
本发明的目的之二在于提供一种实现所述卷积神经网络加速计算方法的计算系统。
本发明的目的之三在于提供一种包括了所述卷积神经网络加速计算方法或所述计算系统的芯片。
本发明的目的之四在于提供一种接收机,该接收机包括了所述的卷积神经网络加速计算方法,或者包括了所述的计算系统,或者包括了所述的芯片。
本发明提供的这种卷积神经网络加速计算方法,包括如下步骤:
S1. 读取偏置量;
S2. 读取权重值;
S3. 读取输入特征图的数据;
S4. 对权重值下发更新指令;
S5. 权重值更新完成后,下发计算指令;
S6. 当前块计算完成后,对计算结果进行缓存;
S7. 重复步骤S4~S6直至所有点计算完成,当前层卷积计算完成。
所述的卷积神经网络加速计算方法,具体为将输出特征图像素点数按照设定值拆分为若干个block块,并依次进行计算;每计算完一个block块后输出。
步骤S2所述的读取权重值,具体包括如下步骤:
当接收到读取权重值指令后,每次从外部存储器读取ICP*OCP个权重,并进行存储,ICP为输入通道并行度,OCP为输出通道并行度;
当接收到更新权重值指令后,将存储的权重数据更新到乘加矩阵中;
在乘加计算过程中,读取下一组乘加计算所需要的权重值;
读取权重值循环时,采用如下步骤控制循环:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长沙金维信息技术有限公司,未经长沙金维信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210054125.7/2.html,转载请声明来源钻瓜专利网。