[发明专利]基于离散系数的深度网络模型压缩方法在审
申请号: | 202210521648.8 | 申请日: | 2022-05-13 |
公开(公告)号: | CN115131646A | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 蒋雯;李祥;邓鑫洋;耿杰 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06V10/82 | 分类号: | G06V10/82;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 深圳科润知识产权代理事务所(普通合伙) 44724 | 代理人: | 刘强强 |
地址: | 710000 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 离散 系数 深度 网络 模型 压缩 方法 | ||
1.一种基于离散系数的深度网络模型压缩方法,其特征在于:包括以下步骤:
步骤一、构建深度网络模型,深度网络模型具有k个卷积层;
步骤二、获取数据集样本,将数据集样本均分为n类,每一类样本类别均包括m个样本,
步骤三、将数据集样本输入深度网络模型,获得特征图集合:按样本类别将样本输入深度网络模型,获取特征图集合X,其中表示第i类样本类别中第j个样本经过第l个卷积层中第fl个卷积核得到的特征图,1≤j≤m,1≤i≤n,1≤l≤k,1≤fl≤cl,cl表示第l个卷积层的卷积核数量;
步骤四、利用特征图集合X计算深度网络模型中各卷积核的激活值
步骤五、利用各卷积核的激活值计算各卷积核的离散系数
步骤六、根据公式计算各卷积核的贡献度表示第l个卷积层中第fl个卷积核的贡献度;
步骤七、根据深度网络模型各层卷积核的贡献度对深度网络模型的各层卷积核进行删减,对删减后的各层卷积核的权重和偏置项重新赋值。
2.按照权利要求1所述的基于离散系数的深度网络模型压缩方法,其特征在于:获取删减后的深度网络模型的关键路径,根据关键路径回溯得到深度网络模型的近似树网络结构。
3.按照权利要求1所述的基于离散系数的深度网络模型压缩方法,其特征在于:各卷积核的激活值的计算方法为:对第i类样本类别中第j个样本在第l个卷积层中第fl个卷积核上基于h×w维度的激活值取最大值,其中第fl个卷积核的维度为h×w×d。
4.按照权利要求1所述的基于离散系数的深度网络模型压缩方法,其特征在于:利用各卷积核的激活值计算各卷积核的离散系数的计算方法为:其中表示卷积核激活值均值在第l个卷积层中第fl个卷积核上的均值,表示卷积核激活值均值在第l个卷积层中第fl个卷积核上的标准差,
5.按照权利要求4所述的基于离散系数的深度网络模型压缩方法,其特征在于:表示第i类样本类别的卷积核激活值均值。
6.按照权利要求4所述的基于离散系数的深度网络模型压缩方法,其特征在于:
7.按照权利要求1所述的基于离散系数的深度网络模型压缩方法,其特征在于:步骤七的具体步骤为:
步骤701、将第x个卷积层共cx个卷积核的贡献度按照从小到大的顺序排序,对所对应的卷积核进行删除,得到第x个卷积层第y+1次压缩后的深度网络模型,对经过第x个卷积层第y+1次压缩后的深度网络模型第x个卷积层的各卷积核的权重和偏置项重新赋值,x的取值依次为k到1,y的取值依次为0到cx-1;
步骤702、将数据集样本输入经过第x个卷积层第y+1次压缩后的深度网络模型,计算第x个卷积层第y+1次压缩后的深度网络模型的第x个卷积层的网络性能下降值tx,若tx<txtes,进入步骤703,否则恢复第x个卷积层第y+1次压缩删除的卷积核,然后进入步骤703,其中tx-set表示第x个卷积层网络性能降低的最大限度值;
步骤703、y的取值加1,返回步骤701,重复执行,直到y的取值为c-1,进入步骤704;
步骤704、x的取值减1,返回步骤701,重复执行,直到x的取值为1。
8.按照权利要求7所述的基于离散系数的深度网络模型压缩方法,其特征在于:tx-set=0.3%。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210521648.8/1.html,转载请声明来源钻瓜专利网。