[发明专利]一种算法与硬件协同优化的混合精度存内计算加速器在审

专利信息
申请号: 202011424498.6 申请日: 2020-12-08
公开(公告)号: CN114611680A 公开(公告)日: 2022-06-10
发明(设计)人: 杨永魁;陈瑞;王峥;陈超;喻之斌 申请(专利权)人: 中国科学院深圳先进技术研究院
主分类号: G06N3/063 分类号: G06N3/063;G06N3/04
代理公司: 北京市诚辉律师事务所 11430 代理人: 范盈
地址: 518055 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 算法 硬件 协同 优化 混合 精度 计算 加速器
【权利要求书】:

1.一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,包括池化模块、累加模块、激活模块、全局缓冲模块及若干个分片模块。

2.根据权利要求1所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述分片模块中包括处理单元PE。

3.根据权利要求2所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述处理单元PE包括若干个突触阵列、PE缓冲器、累加器及输出缓冲器。

4.根据权利要求3所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述突触阵列包括存储单元阵列、模数转换器ADC、位线译码器、字线译码器、模拟多路选择器、位移寄存器。

5.根据权利要求1所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述加速器用于支持混合精度神经网络,通过Caffe平台、Tensorflow平台、或者Pytorch平台对神经网络进行分层混合精度量化。

6.根据权利要求5所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,每层所述神经网络按各自的量化精度,部署到分片模块中。

7.根据权利要求6所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,如果一个所述分片模块不足以部署某一层的权重,则使用多个相同的分片模块。

8.根据权利要求7所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,部署不同的所述神经网络层的分片模块,该分片模块的内部电路设计不一定相同。

9.根据权利要求7所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,部署同一层所述神经网络的分片模块,该分片模块的内部电路设计完全一致。

10.根据权利要求7所述的一种算法与硬件协同优化的混合精度存内计算加速器,其特征在于,所述神经网络层的权重、激励用低位宽的权重代替了全精度位宽或者8位位宽。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011424498.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top