[发明专利]一种基于知识蒸馏的边缘设备场景识别方法及装置在审
申请号: | 202111301637.0 | 申请日: | 2021-11-04 |
公开(公告)号: | CN114241282A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 赵亮;魏政杰;付园坤;金军委;张坤鹏;王建鹏;丁倩;郝展鹏;付宏达 | 申请(专利权)人: | 河南工业大学 |
主分类号: | G06V20/00 | 分类号: | G06V20/00;G06V10/764;G06V10/774;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 郑州大通专利商标代理有限公司 41111 | 代理人: | 高为宝 |
地址: | 450001 河南省*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 边缘 设备 场景 识别 方法 装置 | ||
1.一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,包括:
构建场景识别教师模型,具体包括:采用骨干网络Swin Transformer在数据集ImageNet上进行预训练得到预训练模型;初始化所述预训练模型的网络参数,在场景识别数据集上进行微调训练,当场景识别教师模型的损失函数下降且收敛时,得到场景识别教师模型Plaswin-T;
构建蒸馏损失函数,所述蒸馏损失函数由场景识别教师模型的预测软标签和初始学生模型的预测硬标签之间计算得到;
构建场景识别学生模型,具体包括:采用轻量级卷积神经网络MobileNet V3在场景识别数据集上进行训练,得到初始学生模型;然后以所述蒸馏损失函数作为训练损失函数对所述初始学生模型进行参数更新,当所述蒸馏损失函数下降且收敛时,得到最终的场景识别学生模型;
将待识别场景图片输入至所述场景识别学生模型,得到场景识别结果。
2.根据权利要求1所述的一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,所述场景识别教师模型的损失函数LOSST和所述初始学生模型的损失函数LOSSS均采用多分类交叉熵损失函数,分别如公式(1)和公式(4)所示:
其中,M表示样本类别个数,yi,j∈(0,1)表示第i个样本的第j类真实标签值,表示场景识别教师模型对第i个样本的第j类预测标签值概率,表示初始学生模型对第i个样本的第j类预测标签值概率,N表示数据样本的总个数。
3.根据权利要求1所述的一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,采用公式(2)计算得到所述场景识别教师模型的预测软标签fq:
其中,zi表示第i类场景图像识别的概率,T为蒸馏温度系数,zj表示所有类别场景图像识别的概率。
4.根据权利要求2所述的一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,所述蒸馏损失函数如公式(3)所示:
LOSSdistill=(1-α)CE(ZS,y)+αT2KL(ZS/T,ZT/T) (3)
其中,ZT,ZS分别表示场景识别教师模型和场景识别学生模型的softmax函数输出,CE表示按照公式(4)计算得到的交叉熵,y表示场景识别数据的真实标签值,α为加权系数,T为蒸馏温度系数,KL表示散度或相对熵。
5.根据权利要求1所述的一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,在本地计算机或服务群组上构建训练场景识别教师模型。
6.根据权利要求1所述的一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,先在本地计算机或服务群组上构建训练场景识别学生模型,然后将训练好的场景识别学生模型部署在边缘设备上,最后在边缘设备上对待识别场景图片进行场景识别。
7.根据权利要求1所述的一种基于知识蒸馏的边缘设备场景识别方法,其特征在于,直接在边缘设备上构建训练场景识别学生模型,然后在边缘设备上利用训练好的场景识别学生模型对待识别场景图片进行场景识别。
8.一种基于知识蒸馏的边缘设备场景识别装置,其特征在于,包括:
场景识别教师模型训练模块,用于采用骨干网络Swin Transformer在数据集ImageNet上进行预训练得到预训练模型;初始化所述预训练模型的网络参数,在场景识别数据集上进行微调训练,当场景识别教师模型的损失函数下降且收敛时,得到场景识别教师模型Plaswin-T;
蒸馏损失函数确定模块,用于由场景识别教师模型的预测软标签和初始学生模型的预测硬标签之间计算得到蒸馏损失函数;
场景识别学生模型训练模块,用于采用轻量级卷积神经网络MobileNet V3在场景识别数据集上进行训练,得到初始学生模型;然后以所述蒸馏损失函数作为训练损失函数对所述初始学生模型进行参数更新,当所述蒸馏损失函数下降且收敛时,得到最终的场景识别学生模型;
场景识别模块,用于将待识别场景图片输入至所述场景识别学生模型,得到场景识别结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河南工业大学,未经河南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111301637.0/1.html,转载请声明来源钻瓜专利网。