[发明专利]基于深度可分离卷积模块的剪枝方法及系统在审
申请号: | 202110851399.4 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113592073A | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 秦豪 | 申请(专利权)人: | 上海有个机器人有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063;G06N3/08 |
代理公司: | 北京天盾知识产权代理有限公司 11421 | 代理人: | 梁秀秀 |
地址: | 200040 上海市静*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 可分离 卷积 模块 剪枝 方法 系统 | ||
本发明公开了一种基于深度可分离卷积模块的剪枝方法及系统,所述利用稀疏化方式训练基于深度可分离卷积模块的Mobilenet神经网络;利用剪枝规则对稀疏化训练后的网络模型进行处理,获得剪枝后的Mobilenet神经网络。该方法通过利用稀疏化方式训练深度可分离卷积模块的Mobilenet神经网络,利用剪枝规则对基于深度可分离卷积模块的Mobilenet神经网络进行剪枝,进一步压缩机器人边缘端神经网络的计算量,使得Mobilenet神经网络可以部署在边缘设备上。
技术领域
本发明涉及卷积神经网络压缩技术领域,尤其涉及一种基于深度可分离卷积模块的剪枝方法及系统。
背景技术
在机器人,手机等基于CPU边缘端设备算力有限,部署的深度神经网络的计算量往往决定了网络推理所需要消耗时间。随着卷积神经网络的发展,一种基于深度可分离卷积模块的网络架构在许多边缘端设备上得到应用。深度可分离卷积模块由Depthwise卷积和Pointwise卷积组成,Depthwise卷积本质上是一个大窗口的群卷积,在减少计算量的同时,保持网络的感受野。 Pointwise卷积是小窗口的常规卷积,功能在于调整网络的通道数,保持网络复杂度。一般来说,基于深度可分离卷积的Mobilenet/shufflenet等轻量化网络结构由人工设计,在实际业务场景下,不能直接部署在边缘端设备上,需要对网络结构/参数进一步压缩。
发明内容
本发明实施例提供一种基于深度可分离卷积模块的剪枝方法及系统,以解决现在有的神经网络计算量大,不能直接部署在边缘端设备上。
一种基于深度可分离卷积模块的剪枝方法,所述方法包括:利用稀疏化方式训练基于深度可分离卷积模块的Mobilenet神经网络;利用剪枝规则对稀疏化训练后的网络模型进行处理,获得剪枝后的Mobilenet神经网络。
进一步地,所述Mobilenet神经网络包括多组卷积模块,每组所述卷积模块包括Depthwise卷积块和Pointwise卷积块,训练损失函数Loss为:
Loss=Lossnet+α(LossL1+Lossdiff);
其中,α是调节系数,LossL1为稀疏化损失函数,Lossdiff为一致性损失函数,Lossnet为训练任务损失函数;
所述稀疏化损失函数LossL1为:
LossL1=||GammaP||+||GammaD||;
其中,GammaD为本组可分离卷积模块的Gamma值,GammaP为上一组可分离卷积模块的Gamma值;
所述一致性损失函数Lossdiff为:
其中,Pmask=GammaPprune_thre;Dmask=GammaDprune_thre, prune_thre表示剪枝阈值,prune_thre=le-4,Pmask表示Pointwise卷积块的mask,Dmask表示Depthwise卷积块的mask。
进一步地,所述剪枝规则为:
Mask=(GammaPprune_thre)∪(GammaDprune_thre);
其中,prune_thre表示剪枝阈值,prune_thre=le-4。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海有个机器人有限公司,未经上海有个机器人有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110851399.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于融合注意力机制的半监督图像去模糊方法
- 下一篇:一种表带组装装置