[发明专利]基于脉动阵列的长短期记忆神经网络前向加速系统及方法有效
申请号: | 201910926748.7 | 申请日: | 2019-09-27 |
公开(公告)号: | CN110689123B | 公开(公告)日: | 2023-04-18 |
发明(设计)人: | 李丽;王启航;傅玉祥;陈沁雨;李伟 | 申请(专利权)人: | 南京大学 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/0464;G06N3/08;G06N3/0442 |
代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬;吴扬帆 |
地址: | 210046 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 脉动 阵列 短期 记忆 神经网络 加速 系统 方法 | ||
1.一种基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于包括:
算法控制模块,控制计算流程,输出控制信号,控制门向量计算模块和细胞状态计算模块的交替运行;
门向量计算模块,接收源数据,根据所述控制信号将所述源数据传入脉动阵列,依次计算遗忘门向量ft,输入门向量it,候选门向量zt以及输出门向量ot,当同一个时间序列t中的ot计算完成后产生一个细胞状态计算模块的启动信号;所述源数据包括输入层输入数据、神经元权重项以及神经元偏置项;
细胞状态计算模块,接收所述启动信号后读入门向量数据,计算神经元状态值Ct和隐藏层输出值Ht;
存储模块,接收和输出存储门向量计算模块与细胞状态计算模块的计算结果。
2.根据权利要求1所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于所述长短期记忆神经网络的输入层-隐藏层通过在系统配置阶段实施多条指令配置,将前一隐藏层的输出作为下一隐藏层的输入,实现隐藏层的多次调用,完成任意隐藏层层数的LSTM前向计算。
3.根据权利要求1所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于所述门向量计算模块和细胞状态计算模块采用类脉动阵列,所述类脉动阵列中每个计算单元包含乘法器、加法器以及按位与和比较器。
4.根据权利要求3所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于所述类脉动阵列为32×32的类脉动阵列,最高支持32批次数据的并行处理。
5.根据权利要求1所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于所述存储模块包括数据存储器和系数存储器,数据存储器和系数存储器统一编址;门向量计算模块的源数据存储方式为:输入层的输入数据和隐藏层计算结果Ht存入同一块bank区域,每个bank存放一个批次的输入数据和隐藏层计算结果;神经元权重存入同一块bank区域,其中一个隐藏层神经元的所有权重存放在同一个bank中;偏置项按地址递增的方式存入同一块bank区域。
6.根据权利要求5所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于所述门向量计算模块的计算结果存放方式为:四个门向量的计算结果分别存放在不同的bank区域,其中同一批次的计算结果以地址递增的方式存入各自对应的bank,一个bank存放四个批次的数据。
7.根据权利要求1所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于细胞状态计算模块的计算流程为:将四个门向量计算结果从存储模块中读出并进行重组,以乘累加的形式传入类脉动阵列进行计算,与门向量计算模块共用计算资源。
8.根据权利要求1所述的基于脉动阵列的长短期记忆神经网络前向加速系统,其特征在于还包括存储地址生成模块,存储地址生成模块生成存储地址信号和控制信号,所述存储地址信号产生存储地址与物理存储模块地址的映射;所述控制信号控制存储模块进行源数据的读写。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910926748.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种存储系统和方法
- 下一篇:一种构建神经网络模型的方法及系统