[发明专利]用于混合压缩循环神经网络的稀疏矩阵乘法加速器有效
申请号: | 201911160416.9 | 申请日: | 2019-11-23 |
公开(公告)号: | CN111008698B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 刘诗玮;张怡云;史传进 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/044;G06F7/498 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 混合 压缩 循环 神经网络 稀疏 矩阵 乘法 加速器 | ||
1.一种用于混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,包括:
2组乘累加单元,用于计算循环神经网络中2个不同的输出通道的对应的乘累加单元的计算结果;
所述乘累加单元,包含一个主计算单元和一个辅助计算单元;主计算单元负责计算列组合规则压缩权重对应的乘法运算,辅助计算单元负责计算变长编码非规则压缩权重对应的乘法运算,其乘法结果在主计算单元中累加,完成多个输入通道的乘累加运算;
4个输入存储器,用于存储循环神经网络中的4组输入通道的特征值;
2个列组合权重存储器,用于存储2个不同输出通道对应的列组合规则压缩后的权重矩阵;
1个变长编码权重存储器和1个变长编码索引存储器,用于存储非规则变长编码压缩的权重与索引;
2个输出存储器,用于暂存计算中的中间结果以及最终2个输出通道的最终结果;
2个二级累加器,用于读取输出存储器中的中间结果与乘累加单元的计算结果,并将中间结果与计算结果累加,更新输出结果;
1个解码器,将变长压缩的权重解码传输到对应的乘累加单元中。
2.根据权利要求1所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,主计算单元中的加法器与二级累加器构成本加速器的两级加法结构,不同输入通道乘累加结果在不同的周期与之前的中间结果累加,从而满足含不同数量的输入通道的循环神经网络计算要求。
3.根据权利要求2所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,权重存储器分为列组合权重存储器和变长编码权重存储器;前者用于存储列组合规则压缩后的权重;对于不满足列组合规则压缩的权重,通过变长编码进行压缩存储在后者;保证循环神经网络规则压缩后的剩余权重不被舍去,避免网络性能下降。
4.根据权利要求3所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,乘累加单元与输入存储器之间通过4选1选择器互联,构成可重构的互联网络;通过控制选择器的选择信号向乘累加单元传输压缩权重对应的输入特征值。
5.根据权利要求4所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,变长编码压缩权重经过解码器解压缩后,若解码结果为零权重,辅助计算单元关闭,降低计算功耗。
6.根据权利要求3所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,在列组合权重存储器的压缩算法中,稀疏权重矩阵含8个输入通道,4个输出通道;稀疏权重矩阵每4个输入通道分为一组,一个输出通道内每组4个输入通道裁剪后只含一个非零权重;或者稀疏权重矩阵按照2个或3个输入通道进行分组压缩。
7.根据权利要求6所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,对于列组合规则压缩剩余的权重,采用变长编码进行压缩;变长编码压缩得到一个数据向量和一个索引向量;数据向量为所有非零权重,索引向量首元素表示数据向量中非零权重的个数,其余元素表示数据向量中非零权重前零权重的个数。
8.根据权利要求7所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,对于稀疏性较低的权重矩阵,乘累加单元中的主、辅助计算单元分别计算2个不同的输入通道的乘累加运算;辅助计算单元的乘法结果流入主计算单元的加法器中完成求和运算。
9.根据权利要求8所述的混合压缩循环神经网络的稀疏矩阵乘法加速器,其特征在于,当计算压缩后的权重矩阵时,乘累加单元中的主计算单元接受来自列组合权重存储器中的压缩权重与对应输入特征值完成乘法运算;变长编码压缩的权重与索引经过解码器传入辅助计算单元,与对应输入特征值完成乘法运算;二者在主计算单元加法器中进行求和。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911160416.9/1.html,转载请声明来源钻瓜专利网。