[发明专利]基于剪枝阈值自动搜索的深度神经网络模型压缩方法在审
申请号: | 201910820043.7 | 申请日: | 2019-08-31 |
公开(公告)号: | CN110674939A | 公开(公告)日: | 2020-01-10 |
发明(设计)人: | 刘欣刚;钟鲁豪;朱超;王文涵;吴立帅;代成 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 51203 电子科技大学专利中心 | 代理人: | 周刘英 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 剪枝 神经网络模型 压缩 自动搜索 二分搜索法 嵌入式设备 初始模型 模型参数 模型训练 网格搜索 网络模型 原始网络 阈值区间 自适应 迭代 稀疏 存储 应用 部署 | ||
1.一种基于剪枝阈值自动搜索的深度神经网络模型压缩方法,其特征在于,包括如下步骤:
S1:对待压缩处理的原始网络模型进行模型训练,得到用于剪枝的初始模型;
S2:对模型参数进行自适应网格搜索得到第一剪枝阈值;
S3:结合二分搜索法对第一剪枝阈值对应的阈值区间进一步搜小,寻找更优阈值大小,得到第二剪枝阈值;
其中,第一剪枝阈值对应的阈值区间为[V1*,V1*+σ),V1*表示第一剪枝阈值,σ表示自适应网格搜索的搜索步长,即间隔值;
S4:基于第二剪枝阈值对初始模型进行迭代剪枝处理:
S41:将小于第二剪枝阈值的参数权重置零,得到当前剪枝后的网络模型;
S42:对当前剪枝后的网络模型进行重训练;
S43:判断当前重训练后的网络模型是否存在小于第二剪枝阈值的参数权重,若是,继续执行步骤S41;否则,基于当前重训练后的网络模型得到迭代剪枝处理后的网络模型;
S5:稀疏存储迭代剪枝处理后的网络模型。
2.如权利要求1所述的方法,其特征在于,步骤S2包括如下步骤:
S21:设定模型的准确率下降阈值θa;
S22:获取模型的所有参数权重W,并计算参数权重的绝对值最大值|Wmax|和最小值|Wmin|;
S23:设定阈值间隔大小N,在参数权重的绝对值最大和最小值之间进行等间隔划分,得到阈值间隔值n0:
S24:以n0为间隔值得到多个测试阈值:
S25:测试每个测试阈值对应的模型准确率,在准确率下降范围不超过给定阈值θa的情况下,通过网格搜索得到最优剪枝阈值Vthreshold;
其中,
其中,M表示参数权重W对应的模型参数掩模,掩模值0或1分别表示对参数权重W进行剪枝或保留,W⊙Mn表示剪枝后的参数值,A(·)为在给定参数下网络模型的准确率函数。
3.如权利要求1所述的方法,其特征在于,步骤S3包括如下步骤:
S31:将第一剪枝阈值对应的阈值区间[V1*,V1*+σ)的中值作为初始临时第二剪枝阈值
S32:基于当前临时第二剪枝阈值对初始模型进行剪枝处理,判断剪枝处理后的网络模型准确率的下降值是否不超过给定阈值,若是,则执行步骤S34;否则执行步骤S33;
S33:判断是否大于预置的二分误差值,若是,将新的阈值区间的中值作为新的临时第二剪枝阈值并执行步骤S32;
若否,将作为最后得到的第二剪枝阈值;
S34:判断是否大于预置的二分误差值,若是,将新的阈值区间的中值作为新的临时第二剪枝阈值并执行步骤S32;
若否,将作为最后得到的第二剪枝阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910820043.7/1.html,转载请声明来源钻瓜专利网。