[发明专利]一种深度卷积神经网络快速自动压缩方法在审
申请号: | 202010659862.0 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111860779A | 公开(公告)日: | 2020-10-30 |
发明(设计)人: | 唐文婷;韦星星;王越;李波 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 曹鹏飞 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 深度 卷积 神经网络 快速 自动 压缩 方法 | ||
本发明公开了一种深度卷积神经网络快速自动压缩方法。针对优化目标和待优化模型搜索找到最优模型量化方案:初始化强化学习代理和环境,完成达到指定搜索轮数则输出最优模型;反之单轮搜索。在单轮搜索中,确定每一个可量化层的零比特通道索引和通道最小比特数,计算当前模型该层的量化方案以及量化后模型大小。如果当前可量化层是最后一层且不满足优化目标则调整模型量化方案至满足优化目标或不能调整为止;反之评估量化方案并保存环境参数,若当前可量化层不是最后一层,则继续单轮搜索;反之若当前模型量化方案最优,则保存量化方案为最优模型量化方案。避免了大量人为调参,不需要进行网络减枝与网络量化达成硬件要求,能够快速得到压缩网络。
技术领域
本发明涉及深度神经网络轻量化领域,更具体的说是涉及一种用于目标识别任务的深度卷积神经网络快速自动压缩方法。
背景技术
随着半导体技术和硬件能源的发展,硬件设备已经可以支持较高并发与高吞吐量的计算任务。同时,近十年来计算机视觉技术飞速发展,具有不同特性的深度神经网络应运而生,并在针对遥感图像数据的目标检测识别及场景理解等应用环境下取得了类人的表现。因此,为满足硬件发展需求和在目标检测、识别(如飞机、舰船、地面目标的检测和识别)任务上充分发挥深度神经网络优势,网络轻量化在军事和民用领域具有重要的研究意义。由于深度卷积神经网络参数量巨大且不同硬件平台之间存在差异,如何在满足硬件要求(能耗,模型大小)的前提下保有网络性能使其适配于不同硬件平台是一个亟待解决的难题。
网络减枝与网络量化不但是常用的网络压缩手段而且也是当前研究的重点。1989年,学术界提出关于神经网络结构的优化方法,即在网络性能允许的下降范围内通过减少网络中不必要的连接来获得网络计算量和大小的下降。自此之后,网络减枝过程被建模成一个逐层的通道选择或者逐网络的路径选择问题。工业中,由于将网络减枝建模成逐网络的路径选择问题不但会增加大量的计算、存储开销而且会使压缩流程更加复杂(需要对模型进行微调甚至重新训练),针对训练好的模型,一般使用基于权值的网络减枝算法进行逐层的通道选择。由于逐层的通道选择需要大量的人力劳动来确定每一个可压缩层的合适的层稀疏度(每层中0比特元素个数),关于自适应调整层稀疏度方法的研究逐渐引起工业界和学术界的重视。因为确定待压缩网络中每层层稀疏度的问题可以抽象成一个动态规划的调度问题,而强化学习是解决动态规划的有利手段,故使用强化学习调度压缩任务是近年来研究的重点,如使用强化学习进行自动减枝方法,该方法不但适配不同工业平台且可自适应的确定每层层稀疏度。另一方面,为适配不同种硬件平台,模型的存储精度应进行逐模型甚至更小粒度如逐层的调整。通过K均值方法或使用校验集进行权值调整,逐模型调整存储精度至8比特已可达到模型性能近乎无损的水平。而随着芯片技术的发展,苹果、英伟达、高通等一线芯片设计或生产厂商发布了支持混合精度运算的芯片。为了适配不同硬件平台并进一步发挥硬件优势,关于逐层调整模型存储精度也是近年来研究的热点之一。一些方法使用强化学习可逐层调整每层的模型存储精度。然而,由于问题空间大小的骤增,这些方法并不支持更低粒度如逐通道的模型存储精度调整。
工业协议(MPEG协议ISO/IEC JTC 1/SC 29/WG 11下N18575)规定,衡量轻量化的网络性能将从:模型性能损失,模型大小下降,模型计算量下降,模型压缩时间以及模型解压时间这5个方面衡量。因此,考虑到前3者,现在通用的轻量化框架是“深度压缩”框架。该框架先使用网络减枝技术减少计算量,再使用网络量化技术减少模型大小。这一级联式的设计保证兼容不同的压缩方法,在工业中存在广泛应用。然而该方法同样强调网络性能的保有。因此为了更好的平衡硬件要求与模型性能,该框架可能要求重复进行网络减枝与网络量化任务来搜索到一个更好的压缩后模型,但这也会造成额外的压缩时间开销。工业应用中,针对不同硬件平台定制的轻量化方法是必须的。此时,使用该框架进行网络压缩将会产生不可忽视的时间开销。因此,兼顾模型压缩,性能保有和压缩时间,一直是网络轻量化研究及应用的重点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010659862.0/2.html,转载请声明来源钻瓜专利网。