[发明专利]一种基于循环生成对抗网络的迁移学习排序方法有效
申请号: | 201811051537.5 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109492075B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 赵伟强;赖韩江;印鉴;高静 | 申请(专利权)人: | 中山大学;广东恒电信息科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 生成 对抗 网络 迁移 学习 排序 方法 | ||
1.一种基于循环生成对抗网络的迁移学习排序方法,其特征在于,包括以下步骤:
S1:建立用于学习排序任务的循环生成对抗网络;
S2:建立循环生成对抗网络的损失函数并结合学习排序的损失函数;
S3:进行循环生成对抗网络的迁移学习排序的模型训练,并在目标域测试;
所述步骤S1的具体过程是:
S11:针对学习排序的任务,构建两个生成器G_A和G_B,构建两个辨别器D_A和D_B,他们四个都是由3层全连接网络组成;
S12:首先G_A生成器生成B域的学习排序数据的假特征值,G_B生成器生成A域的学习排序数据的假特征值,同时G_A生成器还生成正负样本的B域的假特征值;
S13:将D_A辨别器用于分别A域的学习排序特征和由G_B生成的特征值,同理D_A辨别器用于分别A域的学习排序特征和由G_B生成的特征值;当辨别器辨别为真实的时候输出约等于1,辨别为假的时候输出约等于0;
S14:将生成出来的B域特征再放入G_B生成器中生成CYCLE_A,同理生成出来的A域特征再放入G_A生成器中生成CYCLE_B;
S15:建立两个和两层全连接RankNet结构一致的排序结构,一个输入为A域特征和A域标签,另一个的输入为用A域特征生成的B域特征和对应的A域标签;
所述步骤S2的具体过程是:
S21:首先CYCLE_LOSS的值由如下部分组成:A域学习排序的真实特征和S14中CYCLE_A的距离的绝对值,B域学习排序的真实特征和S14中CYCLE_B的距离的绝对值;
S22:对于两个辨别器,他们的损失函数分别是辨别各自数据域的真实特征的结果与1的差值加上对各自生成的假特征的辨别结果;
S23:对于生成器G_B的损失函数由CYCLE_LOSS*10和它生成特征值通过辨别器D_A输出值与1的差值的平方组成;
S24:对于生成器G_A的损失函数,其损失函数由CYCLE_LOSS*10和它生成特征值通过辨别器D_B输出值与1差值的平方,同时还包含排序模型的损失函数*5.0,还包括生成特征保持原样本间距离的损失值*5.0;
所述步骤S3的具体过程如下:
S31:循环对抗生成网络中将原特征域和目标特征域的特征作为输入,而排序模型则是将原域特征经过生成对抗网络生成出来的特征和其一一对应的标签作为输入;
S32:为了作为结果比较,同时同步训练一个单独的排序模型,原域特征和对应标签作为输入;
S33:将生成器、辨别器和排序模型的训练比例设置成2:5:9;一共需要迭代3000代,每隔1000代随机打乱下数据,这样使对抗生成网络的稳定性,使用dropout技术减弱过拟合问题;迭代3000代之后,检索精度已经趋于收敛;
S34:将训练好的模型保存,并用这个模型在迁移学习目标域上的测试集进行测试,测试结果使用学习排序官方计算结果的perl脚本计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广东恒电信息科技股份有限公司,未经中山大学;广东恒电信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811051537.5/1.html,转载请声明来源钻瓜专利网。