[发明专利]一种适配深度学习硬件加速器的可重构激活函数硬件装置在审
申请号: | 202211660618.1 | 申请日: | 2022-12-23 |
公开(公告)号: | CN115936076A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王中风;吴晓;梁双;王美琪 | 申请(专利权)人: | 南京大学 |
主分类号: | G06N3/048 | 分类号: | G06N3/048;G06N3/063;G06F7/523 |
代理公司: | 江苏圣典律师事务所 32237 | 代理人: | 于瀚文 |
地址: | 210023 江苏省南*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 学习 硬件 加速器 可重构 激活 函数 装置 | ||
1.一种适配深度学习硬件加速器的可重构激活函数硬件装置,其特征在于,包括函数类型判断单元、ReLU计算单元、简化函数计算单元、可变精度单元和优化函数计算单元;
所述函数类型判断单元根据输入的待计算数据x和待计算的激活函数类型,动态选择激活函数的计算路径;
所述ReLU计算单元根据待计算数据x的符号位判断输入的待计算数据所属的计算区间,并根据激活函数类型进行不同的计算操作,通过数据移位操作或直接数据赋值实现ReLU系列激活函数,所述ReLU系列激活函数包括ReLU函数,ReLU6函数,Leaky ReLU函数;
所述简化函数计算单元得到H-Sigmoid激活函数的计算结果,作为Sigmoid函数计算的初始近似值,同时,通过复用简化函数计算单元内的乘法器配合PReLU函数计算时相应的参数来实现PReLU函数。
2.根据权利要求1所述的一种适配深度学习硬件加速器的可重构激活函数硬件装置,其特征在于,所述可变精度单元对Sigmoid的倒数函数1+e-x进行近似,得到Sigmoid倒数函数的近似值appro_sig_rec,同时,通过复用基于e指数实现的计算逻辑来得到Tanh函数的整式部分1-e-2x的计算结果,提供Sigmoid的倒数函数和Tanh函数的整式部分的近似值。
3.根据权利要求2所述的一种适配深度学习硬件加速器的可重构激活函数硬件装置,其特征在于,所述优化函数计算单元将初始近似值与倒数函数近似值进行如下计算,得到Sigmoid函数优化后的近似值:
Sigmoid(x)=2×H-Sigmoid(x)-H-Sigmoid(x)2×appro_sig_rec
所述优化函数计算单元包括1号乘法器、2号乘法器和3号乘法器;
其中appro_sig_rec为Sigmoid倒数函数的近似值,H-Sigmoid激活函数的计算结果记为中间结果A1,基于上述公式,在优化函数计算单元的1号乘法器进行中间结果A1与中间结果A1的乘法,在2号乘法器进行中间结果A1的平方值与Sigmoid倒数函数的近似值appro_sig_rec的乘法,再将2号乘法器得到结果与中间结果A1通过移位操作得到的2×A1结果进行减法操作,最终得到Sigmoid函数优化后的近似值;
通过复用优化函数计算单元内部的3号乘法器实现H-Swish函数和Tanh函数;通过将Sigmoid函数计算结果乘非线性函数中相应的整式部分来实现Tanh函数和Swish函数,其中Tanh函数的整式部分为1-e-2x,Swish函数的整式部分为x。
4.根据权利要求3所述的一种适配深度学习硬件加速器的可重构激活函数硬件装置,其特征在于,所述简化函数计算单元内部包括4号乘法器,所述简化函数计算单元具体执行如下操作:
根据H-Sigmoid激活函数表达式和PReLU激活函数表达式,H-Sigmoid激活函数在待计算数据x输入范围为(-3,3)和PReLU激活函数在x输入范围为(-∞,0)时,都需要4号乘法器来实现函数计算,在简化函数计算单元内部使用4号乘法器来完成H-Sigmoid函数的操作和PReLUde的α·x操作,其中α是小于1的常数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京大学,未经南京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211660618.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种气压可控真空系统
- 下一篇:一种用于银行柜面实务操作自动测评的系统及方法