[发明专利]卷积神经网络的压缩方法、装置、电子设备和介质有效
申请号: | 201810897749.9 | 申请日: | 2018-08-08 |
公开(公告)号: | CN110826684B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 朱力强 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 曹桓 |
地址: | 100000*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 卷积 神经网络 压缩 方法 装置 电子设备 介质 | ||
1.一种卷积神经网络的压缩方法,其特征在于,卷积神经网络中包括多个依次连接的卷积层,每个卷积层包括至少两个卷积核,包括:
获取所述卷积神经网络中待计算卷积层的输入特征图,其中,所述输入特征图为所述卷积神经网络的输入图像在其沿网络前向传播的过程中,在所述待计算卷积层处形成的输入特征图;
计算所述输入特征图经过所述待计算卷积层中每个卷积核的卷积处理之后,输出特征图的L1范数,得到至少两个L1范数;
利用所述至少两个L1范数对所述待计算卷积层的卷积核进行压缩,压缩之后得到目标卷积神经网络;
其中,所述利用所述至少两个L1范数对所述待计算卷积层的卷积核进行压缩,压缩之后得到目标卷积神经网络包括:
将所述至少两个L1范数中最小L1范数所对应的卷积核删除;或者
将所述至少两个L1范数中前N个最小L1范数所对应的卷积核删除,其中,N为大于1且小于该卷积层卷积核个数的正整数;
所述计算所述输入特征图经过所述待计算卷积层中每个卷积核的卷积处理之后,输出特征图的L1范数包括:
利用公式计算所述待计算卷积层中卷积核K的卷积处理之后,输出特征图的L1范数,其中,K依次取1至M,M为所述待计算卷积层中卷积核的数量,为第i张输入图像xi输入所述卷积神经网络后,卷积核K的输出特征图的L1范数,N为所述输入特征图的数量;
所述方法还包括:
对所述目标卷积神经网络进行训练,得到所述目标卷积神经网络的准确率;
如果所述准确率与预设阈值之间的差值满足第一预设要求,则反复对所述目标卷积神经网络中待计算卷积层的卷积核进行压缩,直至得到压缩之后的所述目标卷积神经网络的准确率与所述预设阈值之间的差值不满足所述第一预设要求。
2.根据权利要求1所述的方法,其特征在于,将所述至少两个L1范数中前N个最小L1范数所对应的卷积核删除包括:
对所述至少两个L1范数按照目标顺序进行排序,得到排序结果,其中,所述目标顺序包括:由大到小的顺序,或者,由小到大的顺序;
将所述排序结果中前N个最小L1范数所对应的卷积核删除。
3.根据权利要求1所述的方法,其特征在于,对所述目标卷积神经网络进行训练,得到所述目标卷积神经网络的准确率包括:
在所述目标卷积神经网络的卷积层的网络连接权值固定不变的情况下,训练所述目标卷积神经网络中的全连接层和输出层,直至所述目标卷积神经网络输出的准确率满足第二预设要求,其中,所述第二预设要求为连续两个准确率之间的差值小于预设差值;
在对所述目标卷积神经网络中全连接层和输出层进行训练之后,对所述目标卷积神经网络中的网络连接权值进行训练。
4.根据权利要求1所述的方法,其特征在于,当所述待计算卷积层为所述卷积神经网络的第一个卷积层时,所述输入特征图为输入至所述卷积神经网络的原始图像;当所述待计算卷积层不是所述卷积神经网络的第一个卷积层时,所述输入特征图为所述待计算卷积层的上一个卷积层的输出特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810897749.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:连接重建方法、设备及系统
- 下一篇:一种2,3-二氯吡啶的制备方法