[发明专利]通道全局排序指导剪枝和量化联合的神经网络压缩方法在审
申请号: | 202211217914.4 | 申请日: | 2022-09-30 |
公开(公告)号: | CN115661511A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 谢卫莹;樊潇怡;张鑫;李云松;雷杰 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464;G06N3/0495;G06N3/082 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 通道 全局 排序 指导 剪枝 量化 联合 神经网络 压缩 方法 | ||
1.一种通道全局排序指导剪枝和量化联合的卷积神经网络压缩方法,其特征在于,包括如下步骤:
(1)获取训练样本集和测试样本集:
获取包括M个目标类别且每个类别包含N幅RGB图像的数据集X,并对每幅RGB图像中的图像类别进行标注,然后随机选取数据集X中每类别包含的N0幅图像,并将所选取的共MN0幅RGB图像及其标签组成训练样本集Xtrain,将剩余的M(N-N0)幅RGB图像及其标签组成测试样本集Xtest,其中M≥10,N≥6000,N0≥0.8N;
(2)构建图像分类卷积神经网络模型O并对其进行迭代训练:
构建包括顺次连接的二维卷积层、批归一化层、分段线性激活层、多个残差单元模块、自适应平均池化层、全连接层和softmax激活函数层的图像分类卷积神经网络模型O;第一残差单元模块包括顺次连接的卷积模块和分段线性激活层,且卷积模块的输入与分段线性激活层跳跃连接;第二残差单元模块包括并行排布的卷积模块和平均池化层,以及与卷积模块和平均池化层的输出端连接的分段线性激活层;卷积模块包括多个二维卷积层、多个批归一化层和一个分段线性激活层;其中二维卷积层和分段线性激活层的总数均为L,L≥55,每个二维卷积层包括I个通道,I≥16;
(3)对图像分类卷积神经网络模型进行迭代训练:
(3a)初始化迭代次数为e,最大迭代次数为E,E≥600,第e次迭代图像分类卷积神经网络模型的权值参数为θe,并令e=0;
(3b)将训练样本集Xtrain作为O的输入,对每个训练样本进行特征提取,得到MN0个特征图,并对每幅特征图中的目标进行分类,得到每个训练样本的分类结果
(3c)采用交叉熵损失函数并通过每个训练样本的分类结果及其对应的标签计算O的损失值再采用随机梯度下降法,通过对权值参数θe的偏导值对θe进行更新,得到本次迭代的图像分类卷积神经网络模型Oe;
(3d)判断e≥E是否成立,若是,得到训练好的图像分类卷积神经网络模型否则,令e=e+1,Oe=O,并执行步骤(3b);
(4)计算训练好的图像分类卷积神经网络模型中所有通道的重要性得分并对图像分类卷积神经网络模型进行剪枝和量化:
(4a)将从训练样本集Xtrain中随机选取的MN1个训练样本及其标签组成的秩生成样本集Xchoose作为的输入,并使用钩子Hook函数提取中输入第c幅图像时每个二维卷积层的每个通道的特征图再对进行奇异值分解,得到输入时每个通道的秩然后根据计算每个通道的平均秩后保存,其中,N1≥0.01N0,1≤l≤L,1≤i≤I;
(4b)通过每个通道的平均秩计算该通道的重要性得分并对训练好的图像分类卷积神经网络模型中重要性得分最低的ρ个通道进行删除,获得剪枝率为Ω的剪枝后的图像分类卷积神经网络模型,其中,al、bl分别表示中可优化的伸缩变量、偏移变量;
(4c)通过每个二维卷积层的I个通道组成的稀疏掩模计算该二维卷积层的稀疏性Sl=||Ψl||0,并根据Sl计算每个二维卷积层的权重量化位宽和每个分段线性激活层量化位宽
其中,表示通道被删除,表示通道未删除,||·||0表示L1范数,表示向上取整操作,是第l个二维卷积层的权重量化位宽上界,是第l个分段线性激活层所需的激活量化位宽上界,p表示惩罚因子;
(4d)根据每个二维卷积层的权重量化位宽和每个分段线性激活层量化位宽对剪枝后的图像分类卷积神经网络模型中每个二维卷积层的权重向量Wl进行量化,同时替换每个分段线性激活层的激活函数,得到量化后权重向量为分段线性激活层的激活函数为的剪枝量化后的图像分类卷积神经网络模型
(5)对剪枝量化后的图像分类卷积神经网络模型重新进行剪枝并更新权重、激活层量化位宽:
通过遗传进化算法对中可优化的伸缩变量al、偏移变量bl进行优化,并通过al、bl的优化结果al*、bl*和每个通道的平均秩重新计算每个通道的重要性得分,然后按重新计算的所有通道的重要性得分对剪枝量化后的图像分类卷积神经网络模型重新进行剪枝并更新的权重、激活层量化位宽,得到更新的剪枝量化后的图像分类卷积神经网络模型
(6)获取图像分类卷积神经网络的压缩结果:
对更新的剪枝量化后的图像分类卷积神经网络模型的权值参数进行微调,获得压缩后的图像分类卷积神经网络模型
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211217914.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种流域集控大数据分类存储方法及系统
- 下一篇:一种高强度防撞性能好的卷板机