[发明专利]一种算法与硬件协同优化的混合精度存内计算加速器在审
申请号: | 202011424498.6 | 申请日: | 2020-12-08 |
公开(公告)号: | CN114611680A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 杨永魁;陈瑞;王峥;陈超;喻之斌 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04 |
代理公司: | 北京市诚辉律师事务所 11430 | 代理人: | 范盈 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 算法 硬件 协同 优化 混合 精度 计算 加速器 | ||
1.一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,包括池化模块、累加模块、激活模块、全局缓冲模块及若干个分片模块。
2.根据权利要求1所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述分片模块中包括处理单元PE。
3.根据权利要求2所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述处理单元PE包括若干个突触阵列、PE缓冲器、累加器及输出缓冲器。
4.根据权利要求3所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述突触阵列包括存储单元阵列、模数转换器ADC、位线译码器、字线译码器、模拟多路选择器、位移寄存器。
5.根据权利要求1所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述加速器用于支持混合精度神经网络,通过Caffe平台、Tensorflow平台、或者Pytorch平台对神经网络进行分层混合精度量化。
6.根据权利要求5所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,每层所述神经网络按各自的量化精度,部署到分片模块中。
7.根据权利要求6所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,如果一个所述分片模块不足以部署某一层的权重,则使用多个相同的分片模块。
8.根据权利要求7所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,部署不同的所述神经网络层的分片模块,该分片模块的内部电路设计不一定相同。
9.根据权利要求7所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,部署同一层所述神经网络的分片模块,该分片模块的内部电路设计完全一致。
10.根据权利要求7所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述神经网络层的权重、激励用低位宽的权重代替了全精度位宽或者8位位宽。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011424498.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:单向阀式管道
- 下一篇:基于EM算法的动态PET参数图像分部重建算法