[发明专利]一种基于深度学习加速器实现单广播多运算的方法有效
申请号: | 201810804165.2 | 申请日: | 2018-07-20 |
公开(公告)号: | CN108960414B | 公开(公告)日: | 2022-06-07 |
发明(设计)人: | 陈书明;杨超;李斌;陈海燕;扈啸;张军阳;陈伟文 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F7/523;G06F7/50 |
代理公司: | 湖南兆弘专利事务所(普通合伙) 43008 | 代理人: | 周长清;胡君 |
地址: | 410073 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 加速器 实现 广播 运算 方法 | ||
1.一种基于深度学习加速器实现单广播多运算的方法,其特征在于,该方法包括:在加速器的乘法器阵列中为指定乘法体配置多个用于存储中间结果的中间值寄存器;执行深度学习的计算过程中,当需要将输入特征值与对应权重值进行乘法运算时,将输入特征值与对应权重值的运算结果存储至对应的所述中间值寄存器中以用于下次计算时使用,直至完成输出特征值的计算;
当执行卷积计算时,每次将输入特征值与对应权重值进行乘法运算后,将运算结果存储在各所述中间值寄存器中,并将乘法运算结果与对应的所述中间值寄存器中存储的上一次计算结果进行加法运算,以完成一次乘加运算,将加法运算结果存储回对应的所述中间值寄存器中以用于下一次的加法运算,直至完成输出特征值的计算;
执行卷积计算时的具体步骤为:
S1.为乘法体阵列中每个乘法体配置中间值寄存器R0~Rn,并将各所述中间值寄存器的值初始化为0;
S2.输入第一个输入特征值X0并与对应的权重值进行乘法运算后,将运算结果存储在中间值寄存器R0中;
S3.输入第i个输入特征值Xi并与对应的权重值进行乘法运算后,将运算结果分别与中间值寄存器R0~中间值寄存器Ri中存储的结果进行加法运算,将加法运算结果对应存储在各中间值寄存器中,其中i=0,1,2,…,n;
S4.循环执行步骤S3,直至完成n个输入特征值的乘加运算后,完成卷积运算的初始化;
S5.完成第一个输出特征值的计算,输出对应的中间值寄存器R0的值,并将中间值寄存器R0的值重新恢复为0;
S6.输入第n+1个输入特征值Xn+1并与对应的权重值进行乘法运算后,将运算结果存储在中间值寄存器R0中,并将运算结果分别与中间值存储器R1~中间值寄存器Rn中的值进行加法运算,将加法运算结果对应存储在各中间值存储器中;
S7.完成一个输出特征值的计算,输出对应的中间值寄存器的值,并将中间值寄存器的值重新恢复为0;
S8.取n=n+1,返回执行步骤S6、S7,直至完成所有输出特征值的计算。
2.根据权利要求1所述的基于深度学习加速器实现单广播多运算的方法,其特征在于,还包括预先将各所述中间结果寄存器初始化为0,在完成一个完整的输出特征之计算并输出后,将对应的所述中间结果寄存器重新恢复为0。
3.根据权利要求1或2所述的基于深度学习加速器实现单广播多运算的方法,其特征在于,具体为每个需参与计算的乘法体配置一组中间值寄存器。
4.根据权利要求1或2所述的基于深度学习加速器实现单广播多运算的方法,其特征在于:对应计算各输入特征值的乘法体共用一组中间值寄存器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810804165.2/1.html,转载请声明来源钻瓜专利网。