[发明专利]一种降低基于ReRAM的CNN加速器功耗的模型剪枝方法有效
申请号: | 202110528672.X | 申请日: | 2021-05-14 |
公开(公告)号: | CN113392969B | 公开(公告)日: | 2022-05-03 |
发明(设计)人: | 孙严 | 申请(专利权)人: | 宁波物栖科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙) 11390 | 代理人: | 胡剑辉 |
地址: | 315000 浙江省宁波市高新区光华路*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 降低 基于 reram cnn 加速器 功耗 模型 剪枝 方法 | ||
本发明公开了一种降低基于ReRAM的CNN加速器功耗的模型剪枝方法,包括以下步骤:确定CNN卷积神经网络的层数,并设定对CNN卷积神经网络层的剪枝顺序;以ReRAM加速器的阵列尺寸为粒度按序依次对每层的卷积神经网络进行切分稀疏,得到多个网络块并获取每个网络块对应的权重;根据每个网络块对应的权重分别获取每个网络块的剪枝策略,确定对网络块的剪枝数量和剪枝位置,以网络块的性能约束为优化条件筛选剪枝策略以进行比特剪枝;冻结已完成剪枝的剪枝方案,并按序移动至下一层进行神经网络的剪枝操作;本发明将每层的卷积神经网络划分为多个网络块进行结构化稀疏,使用强化学习方算法自动化确定每个网络块对应的模型高精度且功耗损失小的剪枝方案。
技术领域
本发明涉及CNN卷积处理技术领域,具体涉及一种降低基于ReRAM的CNN加速器功耗的模型剪枝方法。
背景技术
深度神经网络特别是卷积神经网络(CNN)在计算机视觉和语音处理领域已经取得了突破性的进展,因而成为了许多现代人工智能应用的基础。随着物联网技术的发展,越来越多的CNN模型需要部署到端设备或者边缘设备上以满足各种各样的需求,例如人脸识别、物流自动分拣等。受限于功耗和性能,在云端服务器上训练好的CNN模型往往难以在端设备上有好的性能,因此各种各样CNN加速器技术得到了发展,其中,基于电阻随机存取存储器(ReRAM)的CNN加速器由于具有接近零漏电流,高密度存储以及存储内计算的特性而备受关注。
基于ReRAM的加速器首先需要将神经网络映射到ReRAM的阵列结构上,然后在模拟域内进行计算。由于神经网络模型的大小与ReRAM加速器的存储资源和外围电路的规模直接相关,因此可以通过神经网络稀疏化(剪枝)来降低资源的消耗,神经网络稀疏化主要分为随机稀疏化和结构稀疏化,随机稀疏化的方法会生成大量随机分布的0值,这些0值在ReRAM中无法被跳过,而结构化稀疏可以稀疏ReRAM加速器的整行或者整列,但是为了降低存储空间,需要使用一定的辅助电路和在线调度策略来聚合和分发数据,导致还是会出现额外的功耗开销。
ReRAM中的主要功耗来源是数模转换接口(ADC/DAC)和紧凑的交叉开关阵列(crossbar),如果可以以阵列的尺寸为粒度对网络进行稀疏,使用基于bit的剪枝方案,则神经网络模型的结构特性不会改变,只有数据的不同bit会被稀疏,从而使得该比特对应的crossbar和ADC/DAC可以被释放,从而大幅度降低功耗,但是这种比特剪枝方式还存在的缺陷如下:
对整层的卷积神经网络进行比特剪枝,比特数据多,存在大量的对剪枝策略,依据模型精度和功耗从大量的剪枝策略筛选出符合要求的剪枝策略的难度大,导致剪枝操作的效率低,且稳定性差。
发明内容
本发明的目的在于提供一种降低基于ReRAM的CNN加速器功耗的模型剪枝方法,以解决现有技术中依据模型精度和功耗从大量的剪枝策略筛选出符合要求的剪枝策略的难度大,导致剪枝操作的效率低,且稳定性差的技术问题。
为解决上述技术问题,本发明具体提供下述技术方案:
一种降低基于ReRAM的CNN加速器功耗的模型剪枝方法,包括以下步骤:
步骤100、确定CNN卷积神经网络的层数,并设定对CNN卷积神经网络层的剪枝顺序;
步骤200、以ReRAM加速器的阵列尺寸为粒度按序依次对每层的卷积神经网络进行切分稀疏,得到多个网络块并获取每个所述网络块对应的权重;
步骤300、根据每个所述网络块对应的权重分别获取每个所述网络块的剪枝策略,每个所述剪枝策略确定对所述网络块的剪枝数量和剪枝位置,以所述网络块的性能约束为优化条件筛选所述剪枝策略以进行比特剪枝;
步骤400、冻结已完成剪枝的剪枝方案,并按序移动至下一层进行神经网络的剪枝操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波物栖科技有限公司,未经宁波物栖科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110528672.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种工业生产用机器人
- 下一篇:一种管束结构流致振动的非接触位移测试方法