[发明专利]一种卷积神经网络的加速方法及卷积神经网络加速器在审
申请号: | 202210333277.0 | 申请日: | 2022-03-31 |
公开(公告)号: | CN114662684A | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 刘铎;杨镡;任骜;汪成亮;陈咸彰;谭玉娟 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06F17/15;G06F15/78;G06F7/498 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 颜希文 |
地址: | 404100 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 卷积 神经网络 加速 方法 加速器 | ||
本发明公开了一种卷积神经网络的加速方法及卷积神经网络加速器,包括根据输入特征图数据的地址信息,将从片外存储器中读取到的输入特征图数据暂存至片上存储器的缓存区;在将读取到的输入特征图数据暂存至缓存区的过程中,获取当前暂存的输入特征图数据位于缓存区内的位置;当判断到位置位于预先确定的规定位置,对缓存区进行滑窗处理;在进行滑窗处理时,将滑窗内的所有输入特征图数据拼接成一个待填充输入数据,并将待填充输入数据的剩余通道进行填充处理,得到一个输入数据;利用预先读取到的权重数据,对输入数据进行乘累加运算,得到卷积计算结果。本发明实施例能够提高PE运算阵列进行乘累加运算的资源利用率,进而缩短运算时间。
技术领域
本发明涉及神经网络技术领域,尤其涉及一种卷积神经网络的加速方法及卷积神经网络加速器。
背景技术
随着卷积神经网络的发展,卷积神经网络被广泛应用于计算机视觉、语音识别、自然语言处理、自动驾驶等领域。卷积神经网络在处理过程中会进行较为复杂的计算,其中包括卷积计算。
目前,在卷积计算过程中,当输入特征图数据的通道数量远小于卷积神经网络加速器中的PE运算阵列的通道数量时,通常是将该输入特征数据直接填充零的方式使其适配PE运算阵列的通道数量,以进行后续的乘累积运算,然而,这会导致这一卷积计算过程中的PE运算阵列的资源利用率较低,运算时间较长。
发明内容
本发明提供一种卷积神经网络的加速方法及卷积神经网络加速器,以解决现有技术中PE运算阵列资源利用率较低,运算时间较长的问题,本发明能够提高PE运算阵列资源利用率,进而缩短运算时间。
为实现上述目的,本发明实施例提供了一种卷积神经网络的加速方法,包括:
获取当前卷积层的原始输入特征图数据的总通道数;其中,所述原始输入特征图数据存储于片外存储器;
当所述总通道数小于预设的通道数阈值时,判断所述原始输入特征图数据的尺寸是否大于预设的尺寸阈值;
当判断到所述原始输入特征图数据的尺寸大于预设的尺寸阈值时,对所述原始输入特征图数据进行分块处理,得到若干输入特征图数据;
获取任一所述输入特征图数据的地址信息;
根据所述地址信息,将所述输入特征图数据拼接成一个待填充输入数据,并将所述待填充输入数据的剩余通道进行填充处理,得到一个输入数据;
利用预先读取到的权重数据,对所述输入数据进行乘累加运算,得到卷积计算结果。
作为上述方案的改进,所述根据所述地址信息,将所述输入特征图数据拼接成一个待填充输入数据,并将所述待填充输入数据的剩余通道进行填充处理,得到一个输入数据,包括:
根据所述地址信息,从所述片外存储器中读取所述输入特征图数据,并将读取到的输入特征图数据暂存至片上存储器的缓存区;其中,所述输入特征图数据的列数小于所述缓存区的列数;
在将读取到的输入特征图数据暂存至所述缓存区的过程中,获取当前暂存的输入特征图数据位于所述缓存区内的位置;
判断所述位置是否位于预先确定的规定位置,若是,基于卷积核的尺寸和所述当前卷积层的卷积步长对所述缓存区进行滑窗处理;
在进行滑窗处理时,将滑窗内的所有输入特征图数据拼接成一个待填充输入数据,并将所述待填充输入数据的剩余通道进行填充处理,得到一个输入数据。
作为上述方案的改进,所述判断所述位置是否位于预先确定的规定位置,若是,基于卷积核的尺寸和所述当前卷积层的卷积步长对所述缓存区进行滑窗处理,包括:
判断所述位置是否位于预先确定的规定位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210333277.0/2.html,转载请声明来源钻瓜专利网。