[发明专利]压缩分类神经网络的方法和装置在审
申请号: | 202111146344.X | 申请日: | 2021-09-28 |
公开(公告)号: | CN115879531A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 胡文政;车正平;刘宁;唐剑 | 申请(专利权)人: | 北京航迹科技有限公司 |
主分类号: | G06N3/082 | 分类号: | G06N3/082;G06N3/04;G06V10/774;G06V10/764;G06V10/82 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 马明月 |
地址: | 100089 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 压缩 分类 神经网络 方法 装置 | ||
1.一种压缩分类神经网络的方法,包括:
获取针对分类神经网络的卷积层的候选裁剪方案,所述候选裁剪方案指示所述卷积层的多个通道中的一组通道将被保留;
利用所述分类神经网络处理一组样本,以确定与所述一组通道相关联的特征图;
基于所述特征图,确定第一度量和第二度量,所述第一度量指示所述一组样本中具有相同类别的样本的特征表示之间的第一差异,所述第二度量指示具有不同类别的样本的特征表示之间的第二差异;以及
基于所述第一度量和所述第二度量,更新所述候选裁剪方案,以确定用于裁剪所述分类神经网络的所述卷积层的目标裁剪方案。
2.根据权利要求1所述的方法,其中更新所述候选裁剪方案包括:
基于所述第一度量和所述第二度量,确定所述多个通道的得分,所述得分指示相应通道对于所述第一度量和所述第二度量的影响程度;以及
基于所述多个通道的所述得分,更新所述候选裁剪方案。
3.根据权利要求2所述的方法,其中所述一组通道为第一组通道,并且基于所述多个通道的所述得分更新所述候选裁剪方案包括:
确定所述第一度量和所述第二度量之间的第一度量差异;以及
迭代地执行以下过程:
基于所述第一度量差异,更新所述多个通道的所述得分;
基于所述多个通道的更新的所述得分,从所述多个通道中确定将被保留的第二组通道;
基于所述第二组通道,确定更新的第一度量和更新的第二度量之间的第二度量差异;
如果所述第一度量差异与所述第二度量差异之间的差小于预定阈值,则基于所述第二组通道确定所述目标裁剪方案并终止迭代;以及
如果所述第一度量差异与第二度量差异之间的差大于或等于所述预定阈值,则将所述第二度量差异确定作为新的第一度量差异。
4.根据权利要求1所述的方法,还包括:
基于所述分类神经网络的目标压缩程度,确定所述多个通道中将被保留的所述一组通道的目标数目。
5.根据权利要求4所述的方法,其中所述目标压缩程度指示裁剪后的分类神经网络的目标浮点计算数。
6.根据权利要求4所述的方法,其中所述分类神经网络包括多个卷积层,并且确定所述多个通道中将被保留的所述一组通道的目标数目包括:
基于在所述多个卷积层中保留额外通道引起的性能变化,确定多个收益因子;
基于在所述多个卷积层中保留额外通道引起的浮点计算数的变化,确定多个开销因子;以及
基于所述多个收益因子和所述多个开销因子,确定所述多个卷积层的每个卷积层中被保留的通道的数目。
7.根据权利要求1所述的方法,还包括:
基于所述目标裁剪方案,压缩所述分类神经网络;以及
使经压缩的所述分类神经网络部署于目标计算设备,所述目标计算设备的计算资源数目小于阈值数目。
8.根据权利要求1所述的方法,其中所述一组样本为一组图像样本,所述分类神经网络是用于图像处理的分类神经网络。
9.一种用于压缩分类神经网络的装置,包括:
获取模块,被配置为获取针对分类神经网络的卷积层的候选裁剪方案,所述候选裁剪方案指示所述卷积层的多个通道中的一组通道将被保留;
处理模块,被配置为利用所述分类神经网络处理一组样本,以确定与所述一组通道相关联的特征图;
分析模块,被配置为基于所述特征图,确定第一度量和第二度量,所述第一度量指示所述一组样本中具有相同类别的样本的特征表示之间的第一差异,所述第二度量指示具有不同类别的样本的特征表示之间的第二差异;以及
更新模块,被配置为基于所述第一度量和所述第二度量,更新所述候选裁剪方案,以确定用于裁剪所述分类神经网络的所述卷积层的目标裁剪方案。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航迹科技有限公司,未经北京航迹科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111146344.X/1.html,转载请声明来源钻瓜专利网。