[发明专利]一种双向生成领域自适应数据分类方法在审
申请号: | 202211629963.9 | 申请日: | 2022-12-19 |
公开(公告)号: | CN116150671A | 公开(公告)日: | 2023-05-23 |
发明(设计)人: | 康琦;赵俣;姚思雅;李浩军;徐其慧 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F17/15;G06F18/213;G06N20/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 蔡彭君 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 双向 生成 领域 自适应 数据 分类 方法 | ||
1.一种双向生成领域自适应数据分类方法,其特征在于,方法包括以下步骤:
S1、建立双向生成领域自适应框架,框架包括2个分支,分别为带标签的源域和无标签的目标域,2个分支进行双向的生成对抗和迭代训练,目标域训练过程中,采用伪标签代替目标域标签信息,
其中,源域包括源域生成器和源域分类器,目标域包括目标域生成器和目标域分类器,源域生成器的输入为源域数据,源域分类器的输入为源域生成器输出的数据和源域数据,目标域生成器的输入为目标域数据,目标域分类器的输入为目标域生成器输出的数据和源域生成器输出的数据,分类器输出分类结果;
对源域和目标域分别设置生成式对抗网络的损失函数;
S2、针对源域生成器输出的数据和目标域生成器输出的数据分别设置对应的差异损失函数,基于差异损失函数约束源域和目标域间的分布差异,其中,源域的差异损失函数的表达式为:
其中,k为类别数目,为源域整体gMMD损失,为源域类间cMMD损失;
目标域的差异损失函数的表达式为:
其中,k为类别数目,为目标域整体gMMD损失,为目标域类间cMMD损失;
S3、设置一致性损失函数,对源域分类器和目标域分类器输出的分类结果进行约束;
S4、基于生成式对抗网络的损失函数、差异损失函数和一致性损失函数对框架进行训练,得到训练完成的双向生成领域自适应模型,向训练完成的双向生成领域自适应模型输入作为模型的目标域数据的实际数据,得到实际分类结果。
2.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,所述伪标签基于源域数据训练得到的分类模型得到。
3.根据权利要求2所述的一种双向生成领域自适应数据分类方法,其特征在于,伪标签的表达式为:
其中,为伪标签,Xt为目标域数据,C0为基于源域数据训练得到的分类模型。
4.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,目标域的差异损失函数约束目标域生成器输出的数据与源域数据之间的分布差异。
5.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,源域的差异损失函数约束源域生成器输出的数据与目标域数据之间的分布差异。
6.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,对于源域,生成式对抗网络的损失函数为:
其中,为源域的生成式对抗网络的损失函数,Xs为源域数据,为源域的判别误差,为源域的分类误差。
7.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,对于目标域,生成式对抗网络的损失函数为:
其中,为目标域的生成式对抗网络的损失函数,Xt为目标域数据,为目标域的判别误差,为目标域的分类误差。
8.根据权利要求6或7所述的一种双向生成领域自适应数据分类方法,其特征在于,生成式对抗网络的损失函数中的误差为交叉熵损失。
9.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,对双向的生成对抗和迭代训练包括对源域分类器和目标域分类器的训练。
10.根据权利要求1所述的一种双向生成领域自适应数据分类方法,其特征在于,基于一致性损失函数实现源域分类器和目标域分类器的相互迭代训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211629963.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种精确寻靶系统
- 下一篇:光纤拉丝竖直度检测装置