[发明专利]神经网络模型的处理方法及装置、电子设备、存储介质有效
申请号: | 201910616195.5 | 申请日: | 2019-07-09 |
公开(公告)号: | CN110348572B | 公开(公告)日: | 2022-09-30 |
发明(设计)人: | 张军伟;李诚;梁逸清 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 徐升升;张颖玲 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 模型 处理 方法 装置 电子设备 存储 介质 | ||
1.一种神经网络模型的处理方法,其特征在于,所述方法包括:
获取待处理模型与第二样本图像;所述第二样本图像的采集视角为第二视角;
基于所述第二样本图像,对所述待处理模型的特征提取部分进行训练,得到第一神经网络模型;
获取从电子设备的图像采集设备上采集到的第一样本图像;所述图像采集设备的采集视角为与所述第二视角不同的第一视角;
基于所述第一样本图像,对所述第一神经网络模型进行训练,得到训练好的所述第一神经网络模型;
将第二神经网络模型加载到所述电子设备上;所述第二神经网络模型为训练好的所述第一神经网络模型经过压缩处理而得到的神经网络模型。
2.根据权利要求1所述的方法,其特征在于,所述方 法还包括:
获取所述第一样本图像后,对所述第一样本图像进行以下至少一种处理操作:翻转、旋转、剪裁、平移、亮度调节,得到至少一张处理后的第一样本图像;
所述基于所述第一样本图像,对所述第一神经网络模型进行训练,包括:
基于所述第一样本图像和所述至少一张处理后的第一样本图像,对所述第一神经网络模型进行训练。
3.根据权利要求1所述的方法,其特征在于,所述获取待处理模型包括:
获取所要执行的视觉任务;
根据所要执行的视觉任务,选择所述视觉任务对应的待处理模型。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对训练好的所述第一神经网络模型进行压缩,得到第二神经网络模型。
5.根据权利要求4所述的方法,其特征在于,所述对训练好的所述第一神经网络模型进行压缩,得到第二神经网络模型,包括:
对训练好的所述第一神经网络模型进行剪裁,或者对训练好的所述第一神经网络模型进行剪裁并重训练,得到第二神经网络模型。
6.根据权利要求5所述的方法,其特征在于,所述对训练好的所述第一神经网络模型进行剪裁,包括:
从训练好的所述第一神经网络模型中确定出待剪裁的目标对象,所述目标对象至少包括网络层和神经元中的一种;
从训练好的所述第一神经网络模型中删除所述目标对象。
7.根据权利要求4所述的方法,其特征在于,所述对训练好的所述第一神经网络模型进行压缩,得到第二神经网络模型,包括:
获取目标神经网络模型,所述目标神经网络模型为训练好的所述第一神经网络模型的简化模型;
利用训练好的所述第一神经网络模型,计算第三样本图像的第一预测标签;所述第三样本图像标注有第三真实标签;
基于所述第三样本图像,所述第一预测标签以及所述第三真实标签,训练所述目标神经网络模型;其中,训练好的所述目标神经网络模型为所述第二神经网络。
8.根据权利要求7所述的方法,其特征在于,所述基于所述第三样本图像,所述第一预测标签以及所述第三真实标签,训练所述目标神经网络,包括:
利用所述目标神经网络,计算所述第三样本图像的第二预测标签和第三预测标签;
计算所述第一预测标签和所述第二预测标签的第一损失值,以及所述第三预测标签和所述第三真实标签的第二损失值;
基于所述第一损失值和所述第二损失值,计算目标损失值;
基于所述目标损失值,更新所述目标神经网络的参数。
9.根据权利要求8所述的方法,其特征在于,所述基于所述第一损失值和所述第二损失值,计算目标损失值,包括:
基于第一加权系数和第二加权系数,计算所述第一损失值和所述第二损失值的加权平均值,得到目标损失值;
其中,所述第一加权系数是所述第一损失值对应的加权系数,所述第二加权系数是所述第二损失值对应的加权系数。
10.根据权利要求7至9中任一项所述的方法,其特征在于,所述第三样本图像的采集视角为所述第一视角。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910616195.5/1.html,转载请声明来源钻瓜专利网。