[发明专利]一种基于剪枝的卷积神经网络压缩方法、系统及介质在审

专利信息
申请号: 201911349816.4 申请日: 2019-12-24
公开(公告)号: CN111178525A 公开(公告)日: 2020-05-19
发明(设计)人: 李琳;徐亦农;杨苗苗;赖彬彬;刘凡 申请(专利权)人: 重庆邮电大学
主分类号: G06N3/08 分类号: G06N3/08
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红;陈栋梁
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 剪枝 卷积 神经网络 压缩 方法 系统 介质
【说明书】:

发明请求保护一种基于剪枝的卷积神经网络压缩方法、系统及介质,包括步骤:对训练数据进行预处理;初始化卷积神经网络模型的权重;计算网络连接的显著度,以显著度的分数作为评估连接重要性的标准,并对显著度进行排序:对卷积神经网络进行剪枝,保留top‑k的连接,使得网络稀疏化:训练稀疏化后的卷积神经网络模型,直到模型收敛。本发明在训练之前对网络进行裁剪,省去了预训练和微调流程,极大地简化了剪枝过程的同时保持了网络的准确率,同时通过显著度分数结构化地选择重要的连接,对于不同的网络结构具有鲁棒性,因此可以应用到多种网络结构中而不需要进行过多的调整。

技术领域

本发明属于卷积神经网络压缩技术领域,具体涉及基于剪枝的卷积神经网络压缩方法。

背景技术

近年来,深度神经网络在解决诸如图像分类,人脸识别等计算机视觉任务上表现极为出色,而在不同类型的的神经网络当中,卷积神经网络是表现极为出色的一种。随着卷积神经网络的发展,网络层次逐渐加深,参数规模变大,这使得卷积神经网络在实际部署上受到了极大的限制。一方面是模型尺寸,卷积神经网络的强大能力来自数以百万计的可训练参数。这些参数以及网络结构信息需要存储在磁盘上,并在推理期间加载到存储器中。例如,存储在ImageNet上训练的典型网络模型会占用超过300MB的空间,这对嵌入式设备来说是一个很大的资源负担;另一方面是运行时内存,在推理期间,即使批量大小为1,卷积神经网络的中间激活/响应甚至可能比存储模型参数占用更多的内存空间。这对于高端GPU来说不是问题,但是对于计算能力低的移动设备和嵌入式设备来说,这是不可承受的。因此,对模型进行剪枝以减少模型的大小很有必要。

深度卷积神经网络的模型参数重有很多冗余,可以寻找一种有效的评判手段来判断参数重要性,将不重要的连接或者滤波器进行裁剪来减少模型的冗余,使模型变得更加稀疏,减少计算量。典型的模型剪枝方法包含三步:训练,剪枝和微调,ICCV2017的论文Network Slimming详细的介绍了这种方法,但是此种方法为了达到较好的准确率,通过需要耗费较长的微调时间。目前最新的剪枝方法Rethinking the Value of NetworkPruning发现通过剪枝得到的模型结构从头开始训练可以得到和微调相当甚至更好的结果。

发明内容

本发明旨在解决以上现有技术的问题。提出了一种基于剪枝的卷积神经网络压缩方法、系统及介质。本发明的技术方案如下:

一种基于剪枝的卷积神经网络压缩方法,其包括以下步骤:

(1)获取训练数据并对训练数据进行预处理,包括随机裁剪、随机垂直翻转以及正则化;

(2)初始化卷积神经网络模型的权重;

(3)计算网络连接的显著度,以显著度的分数作为评估连接重要性的标准,并对显著度进行排序,其中为了减少计算量以加快剪枝过程,采用了泰勒展开式近似分析剪枝对于损失函数带来的影响;

(4)对卷积神经网络进行剪枝,将剪枝定义为优化问题如式(1)所示,

式(1)中l(X,Y;θ)代表训练模型的损失函数,X代表输入数据,Y是对应的标签,θ∈Rm代表模型的参数;剪枝即选择所有连接的子集并从网络中移除参数那么余下的参数记作因此,为了最小化损失函数的增长需要选择合适的c*;保留top-k的连接,使得网络稀疏化;

(5)训练稀疏化后的卷积神经网络模型,直到模型收敛。

进一步的,所述步骤(1)对训练数据进行预处理,具体步骤为:

步骤2.1:对于要使用的数据集划分为训练集和测试集,二者的比例为9:1,同时以数据集的一个批次作为训练样本,使用的批次大小为128,所选取的批次公式如式(2)所示,

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911349816.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top