[发明专利]神经网络模型的训练方法、装置和电子设备有效

专利信息
申请号: 201910228494.1 申请日: 2019-03-25
公开(公告)号: CN109961442B 公开(公告)日: 2022-11-18
发明(设计)人: 揭泽群 申请(专利权)人: 腾讯科技(深圳)有限公司
主分类号: G06T7/10 分类号: G06T7/10;G06V10/764;G06V10/82;G06N3/04;G06N3/08
代理公司: 北京市柳沈律师事务所 11105 代理人: 张晓明
地址: 518057 广东省深圳*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 神经网络 模型 训练 方法 装置 电子设备
【说明书】:

本公开提供了一种神经网络模型的训练方法、训练装置、电子设备和计算机可读存储介质。所述神经网络模型的训练方法,包括:通过第一神经网络模型提取训练图像的第一网络特征图;通过待训练的第二神经网络模型提取所述训练图像的第二网络特征图;基于所述第一网络特征图和所述第二网络特征图,确定像素级的分类损失函数;基于所述像素级的分类损失函数,训练所述第二神经网络模型。通过将大型神经网络模型学习到的知识传递给小型神经网络模型,指导小型神经网络模型训练,使得训练后的小型神经网络模型在参数量、运动速度不变的情况下,实现预测精度的显著提升。

技术领域

本公开涉及图像处理领域,更具体地,本公开涉及一种用于图像语义分割的神经网络模型的训练方法、训练装置、电子设备和计算机可读存储介质。

背景技术

神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如图像语义分割、物体检测、动作追踪、自然语言翻译等。神经网络已被人工智能界广泛应用。

目前,在诸如图像语义分割等图像处理应用中,使用的神经网络模型(例如,ResNet101)通常具有数百层和数千通道,因而伴随着巨大的计算复杂度(例如,每秒数十亿次浮点运算(FLOPS)甚至更多),使得此类神经网络模型往往依赖于高性能的服务器集群以满足处理精度和运行速度的要求。随着诸如智能手机、无人车等移动终端对于基于神经网络模型的图像处理应用的需求的不断增加,需要在移动终端配置匹配移动终端处理能力的相对小型的神经网络模型(例如,ResNet18)以实现与服务器端接近的处理精度。

发明内容

鉴于上述问题而提出了本公开。本公开提供了一种神经网络模型的训练方法、训练装置、电子设备和计算机可读存储介质。

根据本公开的一个方面,提供了一种用于图像语义分割的神经网络模型的训练方法,包括:通过第一神经网络模型提取训练图像的第一网络特征图;通过待训练的第二神经网络模型提取所述训练图像的第二网络特征图;基于所述第一网络特征图和所述第二网络特征图,确定像素级的分类损失函数;基于所述像素级的分类损失函数,训练第二神经网络模型。

此外,根据本公开一个方面的训练方法,其中,所述像素级的分类损失函数包括:所述第一神经网络模型和所述第二神经网络模型之间的相反像素级分类损失函数,所述第一神经网络模型和所述第二神经网络模型之间的像素级知识逼近损失函数,以及所述第二神经网络模型自身的像素级分类损失函数。

此外,根据本公开一个方面的训练方法,其中,所述确定像素级的分类损失函数包括:基于所述第一网络特征图生成第一网络注意力图,并且基于所述第二网络特征图生成第二网络注意力图;所述第一网络注意力图与所述第二网络注意力图相减,生成所述第一神经网络模型和所述第二神经网络模型之间的掩膜特征图;所述第二网络特征图与所述掩膜特征图相乘,生成掩膜后的第二网络特征图;所述第一网络特征图与所述掩膜后的第二网络特征图相加作为训练用特征图,以所述第一神经网络模型的逐像素的分类损失的相反数作为所述相反像素级分类损失函数。

此外,根据本公开一个方面的训练方法,其中,所述确定像素级的分类损失函数包括:利用所述第一网络特征图确定所述第一神经网络模型的逐像素的第一分类结果,利用所述第二网络特征图确定所述第二神经网络模型的逐像素的第二分类结果;以所述逐像素的第一分类结果和所述逐像素的第二分类结果的交叉熵作为所述像素级知识逼近损失函数,以所述逐像素的第二分类结果和所述训练图像的交叉熵作为所述自身的像素级分类损失函数;以所述自身的像素级分类损失函数与加权的所述像素级知识逼近损失函数的和作为所述像素级的分类损失函数。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910228494.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top