[发明专利]一种卷积计算方法及装置在审
申请号: | 201811199925.8 | 申请日: | 2018-10-15 |
公开(公告)号: | CN111047025A | 公开(公告)日: | 2020-04-21 |
发明(设计)人: | 梁晓峣;景乃锋;崔晓松;廖健行 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 张皎皎 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 卷积 计算方法 装置 | ||
本申请实施例提供一种卷积计算方法及装置,涉及计算机领域,可以实现高效的卷积计算。卷积计算装置包括:P*P个数据计算单元,P*P个地址计算单元,K*K大小的卷积核;当K>P时,将卷积核切分为子卷积核;对于每一个子卷积核,按照卷积计算方式,将特征矩阵中的特征数据和卷积核中的权值数据相乘,将计算结果按照预定的加法规则相加得到输出数据;计算每个特征数据的目标地址,将具有相同目标地址的输出数据相加得到卷积矩阵。
技术领域
本申请涉及计算机领域,尤其涉及一种卷积方法及装置。
背景技术
卷积神经网络(convolutional neural network,CNN)在图像识别领域的应用越来越广泛。CNN可以对输入的图像进行分类识别操作。在实际的应用中,向CNN输入一张或者多张图片(称之为输入特征图或者输入特征数据),让它历经一系列卷积层、非线性层、池化层和完全连接层,最终输出图像内容的一个单独分类或一组分类,称之为输出特征图或者输出特征数据。例如,向CNN输入一张图片,CNN最终输出一组图像内容的分组:图像的轮廓、图像颜色等内容。卷积神经网络可以应用于各个图片识别领域如安防领域、计算机视觉、平安城市等,还可以应用于语音识别、搜索引擎、机器翻译等等。
CNN的原理是将输入特征图经过滤波器(Filter),与每个滤波器配置的权值(即卷积核)进行卷积运算,得到每个滤波器对应的输出特征图。其中,一个滤波器对应的输出称之为一个输出通道。从CNN的原理可知,其过程需要大量的计算开销和存储需求,因此多样的高效卷积方法被设计出来提高卷积神经网络的计算效率。目前业界有多种神经网络模型,不同的模型中包含的卷积核规格大小种类繁多。如AlexNet模型中有5个卷积层,卷积核的规格包含了11*11、5*5、3*3三种。另外,有的模型中常用的卷积核的规格还包含7*7。在一些卷积神经网络中,不同卷积层配置不同规格大小的卷积核。
现有技术中的卷积运算的计算原理如图1所示。图1示出了一个特征数据集合,该特征数据集合共包括5×5个特征数据。图1还示出了一个权值数据集合,该权值数据集合共包括3*3个权值数据。该权值数据集合可以作为卷积核与该数据特征集合进行卷积运算。如图1还示出了卷积运算过程中的一步运算的示意。如图1所示,特征数据集合中的3*3个权值数据需要分别与特征数据集合中的3*3个数据进行乘法运算。乘法运算的结果相加就得到了卷积结果的一个数据的值。具体地,根据图1所示,卷积结果c11可以表示为:c11=a11×b11+a12×b12+a13×b13+a21×b21+a22×b22+a23×b23+a31×b31+a32×b32+a33×b33。在完成了如图1所示的一步运算后,该权值数据集合按照从上到下、从左向右的顺序滑动,继续下一步运算,直到遍历完整个特征数据集合。
由于卷积神经网络中卷积核规格大小多变,为了适应这一点,业界目前有多种卷积计算设计。一种设计为粗粒度可重构的卷积神经网络加速器,该加速器包括多个处理单元簇,每个处理单元簇包括若干处理单元和一个加法计算单元,其中,加法计算单元与该处理单元簇中的所有处理单元相连接。通过选取不同数量的处理单元和加法计算单元,可以使得该卷积神经网络加速器处理不同大小的卷积核。但是上述做法存在着无法充分利用该卷积神经网络加速器的问题,即没有被选取的处理单元和加法计算单元将会被暂时闲置,该部分的算力将会被浪费,从而导致卷积计算的效率不高。同时,该卷积神经网络加速器还会存在无法处理较大的卷积核的问题。
发明内容
本申请实施例提供一种卷积计算方法及装置,以提高卷积计算时计算单元利用率,进而实现高效的卷积计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811199925.8/2.html,转载请声明来源钻瓜专利网。