[发明专利]一种基于循环生成对抗网络的迁移学习排序方法有效
申请号: | 201811051537.5 | 申请日: | 2018-09-10 |
公开(公告)号: | CN109492075B | 公开(公告)日: | 2021-09-28 |
发明(设计)人: | 赵伟强;赖韩江;印鉴;高静 | 申请(专利权)人: | 中山大学;广东恒电信息科技股份有限公司 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06N3/04;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 生成 对抗 网络 迁移 学习 排序 方法 | ||
本发明提供一种基于循环对抗生成网络的迁移学习排序的方法,本发明是在学习排序的数据集LETOR3.0上进行迁移排序学习,用计算机视觉领域内的循环对抗生成网络做迁移学习框架,即用A域的特征生成B的特征,用B域的特征生成A域的特征,这样生成的特征都包含着另外一个域的特征信息;再用RankNet的学习排序算法对迁移过来的数据进行学习,用学习到的排序模型在目标域进行测试;在学习的过程中完全不涉及到目标域的标签信息。
技术领域
本发明涉及学习排序和计算机视觉相关领域,更具体地,涉及一种基于循环生成对抗网络的迁移学习排序方法。
背景技术
近年来,随着大数据和信息技术突飞猛进的发展,每一天产生的数据信息无法估计,如何在这浩瀚的数据信息中搜索到自己想要的信息显的尤为重要。同时信息检索技术也得很大的发展和应用,在信息检索领域中比较重要的技术之一就是学习排序。学习排序的目的是检索到和查询相关的文档。学习排序的目的是优化一个排序函数,其中包含了广泛的相关特性和避免根据经验大量调整的参数。像其他监督学习的算法一样,学习排序也需要一个很大的用于搜索任务的数据集。这样的数据集是非常难进行人工收集的。比如建立一个医学搜索引擎需要不同于音乐搜索引擎的专家和标签标准,那么收集一个这样的带有标签的数据集更是难上加难。在LETOR3.0中,有几个不同的领域的搜索任务数据集,例如命名页面查找和主题关键词搜索是不同的搜索任务。基于这样的数据集,最近为了解决上述困境出现了一个明确的方向,就是将排名知识从相关域的训练数据转移到目标域,其中目标域是没有标签可用的。因此出现了很多基于这种思路的方法,有个方法是使用少量的目标域数据和标签,这些少量的数据在迁移学习中占很大的权重。其他大多数方法都是根据两个领域的公共信息,利用公共信息的相似性大小对相关域的数据进行加权,然后再训练模型,训练好之后在目标域上进行测试。这种方法在训练的过程中没有直接使用目标域的信息,并且如果两个领域的公共信息比较少时就表现不佳。
对上上述出现的问题,随着最近越来越火的GAN系列结构,我们考虑最近可以生成特征的网络结够GAN,能否将这种对抗生成网络用来做迁移学习呢?所以我们提出了一种基于循环生成对抗网络迁移学习的排序模型。
发明内容
本发明提供一种利用迁移学习的一种基于循环生成对抗网络的学习排序方法。
为了达到上述技术效果,本发明的技术方案如下:
一种基于循环生成对抗网络的迁移学习排序方法,包括以下步骤:
S1:建立用于学习排序任务的循环生成对抗网络;
S2:建立循环生成对抗网络的损失函数并结合学习排序的损失函数;
S3:进行循环生成对抗网络的迁移学习排序的模型训练,并在目标域测试。
进一步地,所述步骤S1的具体过程是:
S11:针对学习排序的任务,构建两个生成器G_A和G_B,构建两个辨别器D_A和D_B,他们四个都是由3层全连接网络组成;
S12:首先G_A生成器生成B域的学习排序数据的假特征值,G_B生成器生成A域的学习排序数据的假特征值,同时G_A生成器还生成正负样本的B域的假特征值。
S13:将D_A辨别器用于分别A域的学习排序特征和由G_B生成的特征值,同理D_A辨别器用于分别A域的学习排序特征和由G_B生成的特征值;当辨别器辨别为真实的时候输出接近1,辨别为假的时候输出接近0.
S14:(为了让从A域生成B域的特征能保持A域的一些特征)将生成出来的B域特征再放入G_B生成器中生成CYCLE_A,同理生成出来的A域特征再放入G_A生成器中生成CYCLE_B;
S15:建立两个和两层全连接RankNet结构一致的排序结构,一个输入为A域特征和A域标签,另一个的输入为用A域特征生成的B域特征和对应的A域标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学;广东恒电信息科技股份有限公司,未经中山大学;广东恒电信息科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811051537.5/2.html,转载请声明来源钻瓜专利网。