[发明专利]一种模型的训练方法、图像增强方法及设备在审
申请号: | 202110221444.8 | 申请日: | 2021-02-27 |
公开(公告)号: | CN113065635A | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 张依曼;陈汉亭;陈醒濠;王云鹤;许春景 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06T3/40;G06T5/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 模型 训练 方法 图像 增强 设备 | ||
本申请实施例公开了一种模型的训练方法、图像增强方法及设备,可应用于人工智能领域中的图像处理领域,具体可用于超分辨率重建任务,该方法针对由生成网络、教师网络、学生网络构成的模型重新构建了一套损失函数,用于提升生成网络和学生网络的训练效果。在提升生成网络训练效果方面,基于超分辨重建任务的特性(即超分辨图像具有低分辨图像的所有信息,并包含更多细节信息),针对超分辨重建任务构建了一种训练生成网络的损失函数,提升了模型在超分辨重建任务上的训练效果;在提升学生网络训练效果方面,由于无数据的知识蒸馏十分困难,为了降低蒸馏难度,采用渐进蒸馏方式训练学生网络,直至训练完整个学生网络,降低了蒸馏难度。
技术领域
本申请涉及机器学习领域,尤其涉及一种模型的训练方法、图像增强方法及设备。
背景技术
为了将神经网络应用到计算资源受限的小型移动设备(如,手机)上,需要对其进行压缩和加速。知识蒸馏是一种模型压缩技术,将复杂、学习能力强的网络学到的特征表示“知识”蒸馏出来并传递给参数量小、学习能力弱的网络。知识蒸馏可以将一个网络的知识转移到另一个网络,做法是先采用训练数据训练一个教师(teacher)网络,然后使用这个teacher网络的输出训练学生(student)网络。
由于神经网络的压缩通常需要训练数据,但在实际应用过程中,由于隐私政策和法律等的限制,训练数据常常不可获得。当前有很多工作致力于开发无数据模型压缩技术,这些无数据模型压缩技术一般是由生成网络、教师网络和学生网络组成模型框架,并利用蒸馏技术训练学生网络得到。训练的流程为:生成网络接收随机噪声然后生成图像,这些生成的图像会被同时输入到教师网络和学生网络中。然后利用蒸馏技术训练学生网络使得学生网络的输出和教师网络的输出比较相像,并训练生成网络使得生成网络生成的图像的分布和数据集的分布相近。
目前的无数据压缩技术主要集中于分类及分割任务。
发明内容
本申请实施例提供了一种模型的训练方法、图像增强方法及设备,该模型包括生成网络、教师网络以及学生网络,针对超分辨重建任务提出了一种训练生成网络的新的损失函数(即第一损失函数),提升了该模型在超分辨率重建任务上的训练效果。
基于此,本申请实施例提供以下技术方案:
第一方面,本申请实施例首先提供一种模型的训练方法,可用于人工智能领域中,该方法包括:首先,训练设备利用构建的第一损失函数和第二损失函数对模型中的生成网络进行训练,其中,该第一损失函数用于表征第一图像与第二图像之间的差异,第一图像为生成网络根据输入的随机初始化噪声生成的图像,第二图像为对第三图像进行下采样得到的图像,第三图像为教师网络对输入的第一图像进行超分辨重建得到的图像。需要注意的是,在本申请实施例中,该教师网络为预先训练好的神经网络,其模型参数始终保持不变,而该生成网络在第一次训练时的模型参数可以是随机初始化的。训练设备在对生成网络进行一次迭代训练后,将得到本轮训练后的生成网络,之后,训练设备进一步利用第三损失函数对模型中的学生网络进行训练,其中,第三损失函数用于表征第四图像与第五图像之间的差异,第五图像为教师网络对输入的第六图像进行超分辨重建得到的图像,第六图像为训练后的生成网络根据输入的随机初始化噪声生成的图像,第四图像为学生网络对输入的第六图像进行超分辨重建得到的图像。同样需要注意的是,在本申请实施例中,该教师网络的模型参数依然保持不变,而该生成网络的模型参数则为上述训练得到的生成网络,该学生网络在第一次训练时的模型参数同样可以是随机初始化的。最后,训练设备重复执行上述交替训练生成网络和学生网络的过程,直至达到迭代终止条件(可称为第一迭代终止条件)。
在本申请上述实施方式中,提供了一种模型的训练方法,该模型包括生成网络、教师网络以及学生网络,并针对特定的超分辨重建任务,提出了一种训练生成网络的新的损失函数(即第一损失函数),提升了该模型在超分辨率重建任务上的训练效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110221444.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序