[发明专利]基于正则化的解决对抗残差变换网络梯度消失问题的方法在审
申请号: | 201911312025.4 | 申请日: | 2019-12-18 |
公开(公告)号: | CN111191793A | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 何良华;蔡冠羽 | 申请(专利权)人: | 同济大学 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 宣慧兰 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 正则 解决 对抗 变换 网络 梯度 消失 问题 方法 | ||
1.一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,包括以下步骤:
步骤S1:特征提取器提取源域的源数据和目标域的目标数据的特征分布;
步骤S2:转换网络将所述源数据的特征分布映射到所述目标域,生成伪造目标数据;
步骤S3:所述伪造目标数据通过训练建立标签分类器,通过所述标签分类器预测目标数据的标签值;
步骤S4:域分类器对比所述伪造目标数据与目标数据,并将对比结果反馈给所述特征提取器,特征提取器根据对比结果对特征分布的提取过程进行改进,所述转换网络优化源数据到目标域的映射方式;
步骤S5:循环执行步骤S1-S4,直至域分类器不能准确分辨伪造目标数据与目标数据,即对抗残差变换网络模型的损失函数的值收敛,所述转换网络的映射方式使源域和目标域之间达到域适应状态,其特征在于,所述损失函数设有正则化项,所述正则化项的公式如下:
其中,r(G(xs),T(G(xs)))为正则化项,G为特征提取器函数,T为转换网络函数,xs为源域的源数据,·代表内积运算,||代表L2范式。
2.根据权利要求1所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述损失函数的具体公式如下所示:
其中,β表示正则化项的系数参数,表示源域第i个样本的域标签,表示目标域第i个样本的真实域标签,Lc、Lt、Ls分别表示标签分类器的损失、目标数据在域分类器的损失和源数据在域分类器的损失,θd、θg、θc、θt分别为域分类器、特征提取器、标签分类器及转换网络的设定参数,ns为源域中样本数量,Ds表示源域,Dt表示目标域,xi表示对应域中第i个样本实例,yi表示源域中样本实例对应的标签类别,D表示域分类器函数,C表示标签分类器函数,L为目标域的目标函数。
3.根据权利要求2所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述域分类器、特征提取器、标签分类器及转换网络的设定参数对应源域和目标域之间达到域适应状态时的最优值分别为:
其中,为域分类器设定参数的最优值,为特征提取器设定参数的最优值,为标签分类器设定参数的最优值,为转换网络设定参数的最优值,r为正则化项对应的正则化函数。
4.根据权利要求2所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述特征提取器和转换网络对应的目标函数更新为:
其中,为特征提取器和转换网络对应的目标函数,D*为最优域分类器,JSD为Jensne-Shannon散度,Ps为源域的源分布,Pt为目标域的目标分布。
5.根据权利要求4所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述特征提取器和转换网络对应的目标函数中r(θg,θt)相应变量的微分值和均不为零。
6.根据权利要求1所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述步骤S1的特征提取器为权重共享特征提取器。
7.根据权利要求1所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述特征提取器与转换网络设有剩余连接,所述剩余连接从源域中捕获源数据的语义信息。
8.根据权利要求1所述的一种基于正则化的解决对抗残差变换网络梯度消失问题的方法,其特征在于,所述步骤S5中,域分类器和特征提取器通过设置梯度反转层来进行参数优化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911312025.4/1.html,转载请声明来源钻瓜专利网。