[发明专利]对抗生成神经网络的训练方法及系统有效
申请号: | 202010138371.1 | 申请日: | 2020-03-03 |
公开(公告)号: | CN111445007B | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 陈卓均;陆进;陈斌;宋晨 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/084 |
代理公司: | 北京英特普罗知识产权代理有限公司 11015 | 代理人: | 王勇 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 对抗 生成 神经网络 训练 方法 系统 | ||
本发明实施例提供一种对抗生成神经网络的训练方法,包括步骤:建立初始判别神经网络和初始生成神经网络以组成初始对抗生成神经网络;初始化初始对抗生成神经网络的参数和边界向量;获取真实样本集合和随机变量集合,并将随机变量集合输入到初始生成神经网络中以生成假样本集合;将真实样本集合和假样本集合输入到初始判别神经网络,以得到第一判别输出和第二判别输出;根据预设的判别损失函数进行计算得到判别损失值;根据预设的生成损失函数进行计算得到生成损失值;根据判别损失值和生成损失值对初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。通过本发明实施例,能够提高对抗生成神经网络的训练速度和稳定性。
技术领域
本发明实施例涉及计算机技术领域,尤其涉及一种对抗生成神经网络的训练方法、系统、计算机设备及存储介质。
背景技术
赫瑞-瓦特大学(Heriot-Watt University)和谷歌深度神经(Google Deepmind)公司的大规模对抗生成网络训练案例表明,以折页损失函数(Hinge Loss)作为目标函数可以提高对抗生成网络的稳定性。但是目前的训练方法对Hinge Loss边界的改变相当敏感,边界小时训练稳定,但生成效果偏差;边界大时训练容易造成判别器梯度消失或发生崩溃,但是效果更好。但是如果人工对边界进行调参会严重影响效率;另一方面,目前使判别器输出一维标量然后以其计算目标损失的方法依赖于单一维度的固定边界,会带来模型表征能力的局限性,而且一旦该维度出现崩溃,整个网络将无法恢复,所以训练难度仍然很大。
因此,本发明实施例旨在解决对抗生成神经网络稳定性差和效率低的问题。
发明内容
有鉴于此,本发明实施例提供了一种对抗生成神经网络的训练方法、系统、计算机设备及计算机可读存储介质,能够将对抗生成神经网络的输出映射为高维输出,使得对抗生成神经网络可以在不同的维度和边界进行训练,从而获得较大的收敛梯度,提高了对抗生成神经网络的训练速度和稳定性。
本发明实施例是通过下述技术方案来解决上述技术问题:
一种对抗生成神经网络的训练方法,包括:
建立初始判别神经网络和初始生成神经网络,并将所述初始判别神经网络和所述初始生成神经网络组成初始对抗生成神经网络;
初始化所述初始对抗生成神经网络的参数和所述初始判别神经网络的边界向量,其中,所述边界向量是一个具有预设维度数量的多维向量,所述初始对抗生成神经网络的参数包括所述初始判别神经网络的判别参数和所述初始生成神经网络的生成参数;
获取真实样本集合和随机变量集合,并将所述随机变量集合输入到所述初始生成神经网络中,以生成假样本集合;
将所述真实样本集合和所述假样本集合输入到所述初始判别神经网络,以得到与所述真实样本集合对应的第一判别输出和与所述假样本集合对应的第二判别输出;
根据预设的判别损失函数LD=E[max(0,M-D(x))]+E[max(0,M+D(G(z)))]对所述第一判别输出和所述第二判别输出进行计算以得到判别损失值,其中,LD表示判别损失值,E表示数学期望值,max(0,M-D(x))表示关于0和M-D(x)的最大值函数,max(0,M+D(G(z)))表示关于0和M+D(G(z))的最大值函数,M表示所述边界向量,D(x)表示所述第一判别输出,D(G(z))表示所述第二判别输出;
根据预设的生成损失函数LG=-E[D(G(z))]对所述第二判别输出进行计算以得到生成损失值,其中,LG表示所述生成损失值;
根据所述判别损失值和所述生成损失值对所述初始对抗生成神经网络的参数进行更新以得到目标对抗生成神经网络。
进一步地,所述初始判别神经网络的边界向量的初始化,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010138371.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种接触件局部退软装置
- 下一篇:人脸关键点修正方法、装置以及计算机设备