[发明专利]可重构的自然语言深度卷积神经网络加速器有效
申请号: | 201911083419.7 | 申请日: | 2019-11-07 |
公开(公告)号: | CN111126593B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 刘诗玮;张怡云;史传进 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/0464 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 可重构 自然语言 深度 卷积 神经网络 加速器 | ||
1.一种可重构的自然语言深度卷积神经网络加速器,是基于时间序列输入的,其特征在于,包括:
16组可重构的计算单元向量,每组计算单元向量包含6个计算单元;用于计算卷积神经网络中16个不同的输入通道;
6组16输入加法树,用于求和16个输入通道的乘法结果,得到最多6个输出通道的中间结果;
16个用于存储输入特征图的存储单元;
6组输出特征图存储单元,用于存储最多6个输出通道上的中间结果以及最终的输出特征图;
一个控制单元,用于配置计算单元向量、计算流程以及数据流向;
其中,所述计算单元向量中的6个计算单元,其连接关系可以重构,用于计算不同尺寸的卷积核,以高的计算资源利用率;所述的输出特征图存储单元暂存中间结果并与不同的计算单元进行数据交互,避免逐层计算空洞卷积时输出特征图的重复计算;所述6个计算单元连接关系可以重构,具体配置为1x6,2x3,3x2,5x1的连接结构,用于同时计算1x1卷积核的6个输出通道,或同时计算2x1卷积核的3个输出通道,或同时计算3x1卷积核的2个输出通道,或计算5x1卷积核的1个输出通道。
2. 根据权利要求1所述的可重构的自然语言深度卷积神经网络加速器,其特征在于,每组输入特征图存储单元与计算单元向量用于计算卷积的一个输入通道; 16个输入通道的乘法结果经过加法器得到一个输出通道的中间结果;当前时刻的中间结果与之后输入的时间序列对应的中间结果在下一个计算单元中完成累加得到最终的输出特征图。
3.根据权利要求1所述的可重构的自然语言深度卷积神经网络加速器,其特征在于,输入特征图根据输入通道索引存储在不同的输入特征图存储单元中,作为同组的计算单元向量的输入;输出特征图根据输出通道索引存储在不同的输出特征图存储单元中。
4.根据权利要求1、2或3所述的可重构的自然语言深度卷积神经网络加速器,其特征在于,输入特征图存储单元通过广播的方式将输入特征值传输到不同连接结构的起始计算单元。
5.根据权利要求4所述的可重构的自然语言深度卷积神经网络加速器,其特征在于,输入的时间序列逐次传入起始计算单元中并传播到后续计算单元中,与暂存在计算单元中的权重完成乘法运算;乘法结果求和后的中间结果存储在输出存储特征图存储单元中,以供与之后输入的时间序列完成卷积运算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911083419.7/1.html,转载请声明来源钻瓜专利网。