[发明专利]一种针对GoogLeNet模型的加速器及其方法有效
申请号: | 201910416021.4 | 申请日: | 2019-05-19 |
公开(公告)号: | CN110288078B | 公开(公告)日: | 2023-03-24 |
发明(设计)人: | 王瑶;席挺;王宇宣 | 申请(专利权)人: | 南京惟心光电系统有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/048;G06N3/063;G06N3/067 |
代理公司: | 江苏法德东恒律师事务所 32305 | 代理人: | 李媛媛 |
地址: | 210000 江苏省南京市江宁区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 googlenet 模型 加速器 及其 方法 | ||
本发明公开一种针对GoogLeNet模型的加速器及其方法。加速器包括:控制器,用于控制卷积运算和全连接运算的控制信号流和数据流,并把最终结果输出保存到存储器中;光电计算阵列,用于完成卷积运算和全连接运算映射后的矩阵向量乘操作;模数转换器,用于将光电计算阵列输出的电流转化为数字信号;激活函数单元,用于完成卷积运算和全连接运算结果的加偏置和激活函数操作;池化单元,用于完成结果的最大值池化操作。本发明基于光电计算阵列实现GoogLeNet模型的卷积操作和全连接操作,能有效加速GoogLeNet模型的推断过程,具有高能效和无需反复访问片外存储等优点。
技术领域
本发明涉及一种基于光电计算阵列的GoogLeNet模型的加速器及其方法,属于光电计算领域以及神经网络算法领域。
背景技术
神经网络是当前人工智能领域的研究热点,而提升神经网络性能最直接的办法就是增加网络深度和宽度,其中,深度指网络层次数量,宽度指神经元数量。但这种方式存在以下问题:(1)参数太多,如果训练数据集有限,很容易产生过拟合;(2)网络越大、参数越多,计算复杂度越大,难以应用;(3)网络越深,容易出现梯度弥散问题(梯度越往后穿越容易消失),难以优化模型。解决这些问题的方法是在增加网络深度和宽度的同时减少参数。而为了减少参数,需要将全连接变成稀疏连接。但是在实现上,全连接变成稀疏连接后实际计算量并不会有质的提升,因为大部分硬件是针对密集矩阵计算优化的,稀疏矩阵虽然数据量少,但是计算所消耗的时间却很难减少。
针对上述问题,GoogLeNet团队提出了Inception网络结构,通过设计一个稀疏网络结构,能够产生稠密的数据,既能增加神经网络表现,又能保证计算资源的使用效率,在实验中取得了不错的效果。然而由于GoogLeNet模型相当庞大,卷积运算和全连接运算所需的特征图和权重数据规模庞大,导致了在数据传输上产生了极大的能量消耗,并且传统计算系统的运算速度较慢。
发明内容
为了克服现有计算系统的不足,本发明针对GoogLeNet模型提出一种加速器结构。本发明的另外一个目的是提供该加速器的加速方法。
本发明加速器采用的技术方案如下:
一种针对GoogLeNet模型的加速器,包括:控制器,用于控制卷积运算和全连接运算的控制信号流和数据流,并把最终结果输出保存到存储器中;光电计算阵列,用于完成卷积运算和全连接运算映射后的矩阵向量乘操作;模数转换器,用于将光电计算阵列输出的电流转化为数字信号;激活函数单元,用于完成卷积运算和全连接运算结果的加偏置和激活函数操作;池化单元,用于完成结果的最大值池化操作。
进一步地,所述光电计算阵列由多个光电计算单元周期性排列组成,每个光电计算单元包括发光单元和计算单元,发光单元发出的光入射到计算单元中;每个计算单元包括载流子控制区、耦合区、以及光生载流子收集区和读出区;所述载流子控制区用于控制并调制光生载流子收集区和读出区内的载流子;所述光生载流子收集区和读出区中的收集区用于吸收发光单元发射的光子并收集产生的光生载流子;所述载流子控制区或者光生载流子收集区和读出区中的读出区与电信号连接,读出区用于输出被所述光生载流子和所述电信号作用后的载流子;所述耦合区连接收集区和读出区。
进一步地,加速器还包括辅助分类器,用于避免梯度消失,所述辅助分类器连接在卷积层之后。
本发明利用光电计算阵列完成模型中卷积运算和全连接运算映射后的矩阵向量乘操作,其中,卷积运算具体包括如下步骤:
(1)将模型中每层的各个卷积核展开,排列成矩阵,并将每层的输入特征图展开成向量形式;在输入特征图为多通道的情况下,将各通道特征图展开得到的向量首尾拼接,同时各通道卷积核展开得到的矩阵以对应的方式进行拼接;
(2)将光电计算单元排列成阵列,阵列的行列数与步骤(1)卷积核展开形成的矩阵行列数相同;将阵列中每一列计算单元的光生载流子收集区和读出区的输出端依次相连,每一行计算单元的载流子控制区依次相连;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京惟心光电系统有限公司,未经南京惟心光电系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910416021.4/2.html,转载请声明来源钻瓜专利网。