[发明专利]一种基于循环一致性对抗学习的用户身份对齐方法有效
申请号: | 202011131205.5 | 申请日: | 2020-10-21 |
公开(公告)号: | CN112508724B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 潘理;郑聪惠;王晓燕 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06K9/62;G06N3/04 |
代理公司: | 上海旭诚知识产权代理有限公司 31220 | 代理人: | 郑立 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 循环 一致性 对抗 学习 用户 身份 对齐 方法 | ||
1.一种基于循环一致性对抗学习的用户身份对齐方法,其特征在于,包括以下步骤:
步骤1、输入源网络与目标网络以及表示向量的维度d,其中,分别为源网络和目标网络的用户节点集合,分别为源网络和目标网络的属性节点集合,εs,εt分别为源网络和目标网络的节点连边集合,εs={εuus,εuas},εt={εuut,εuat},其中,εuus,εuut分别表示源网络和目标网络的用户节点之间的连边集合,εuas,εuat分别表示源网络和目标网络的用户节点和属性节点之间的连边集合;
步骤2、学习所述源网络节点表示向量与所述目标网络节点表示向量
步骤3、基于第一生成器Gst将所述源网络表示向量映射到目标网络表示空间即对于每个所述源网络节点向量基于所述第一生成器Gst得到e′(ui)=Gst(e(ui));基于第二生成器Gts将目标网络表示向量映射到源网络表示空间即对于每个所述目标网络节点向量基于所述第二生成器Gts得到e′(uj)=Gts(e(uj));
步骤4、建立与所述第一生成器Gst对应的第一判别器Dt、与所述第二生成器Gts对应的第二判别器Ds,所述第一判别器和所述第二判别器均设计为能量函数,Dt基于进行预训练得到初始化参数,Ds基于进行预训练得到初始化参数;
步骤5、对于所述源网络和所述目标网络每个节点的表示向量e(us),e(ut),循环执行步骤6到10;
步骤6、所述第一生成器Gst和所述第一判别器Dt之间进行基于能量的对抗学习,Dt按照最小化以下公式更新其权重
其中,m为实现定义的上限阈值;
步骤7、所述第一生成器Gst按照最小化以下公式更新其权重
步骤8、所述第二生成器Gts和所述第二判别器Ds之间进行基于能量的对抗学习,Ds按照最小化以下公式更新其权重
步骤9、所述第二生成器Gts按照最小化以下公式更新其权重
步骤10、所述第一生成器Gst与所述第二生成器Gts之间进行循环一致性学习,
基于梯度下降法按照最小化第三公式更新权重向量和偏置向量;
所述第三公式为:
其中,d(·)为余弦距离函数;
步骤11、对于所述源网络中任意节点按照步骤12到14得到其在所述目标网络中的对应的锚用户
步骤12、基于所述第一生成器Gst得到的表示向量在所述目标网络中的映射向量
步骤13、计算与所述目标网络中每个节点向量的余弦相似度,按降序进行排序;
步骤14、取相似度最大的30个目标网络节点,若数据集中包含用户名属性,则将所述相似度最大的30个目标网络节点和分别进行用户名比对,用户名最相似的节点为在所述目标网络中的对应锚用户,若所述数据集中不包含用户名属性,则取相似度最大的节点作为在目标网络中的对应锚用户;
其中,所述步骤3包括:
步骤3.1、建立所述第一生成器Gst和所述第二生成器Gts,它们分别为三层的神经网络,每层的神经元数分别为d,d+400,d+800,d,通过随机取值得到初始化的第k层与第k+1层之间的权重向量和偏置向量
步骤3.2、将中的节点向量e(ui)依次输入所述第一生成器Gst,通过Gst的逐层计算,得到所述节点向量e(ui)在目标网络表示空间中的映射向量e′(ui),每一层的输出向量计算方式如下:
yik=σ(Wstkyik-1+bstk),k=2,3,4,
其中,σ为sigmoid函数,最后一层的输出yi4即为Gst输出的映射后的表示向量e′(ui);
步骤3.3、将中的节点向量e(uj)依次输入所述第二生成器Gts,通过Gts的逐层计算,得到其在源网络表示空间中的映射向量e′(uj),每一层的输出向量计算方式如下:
yjk=σ(Wtskyjk-1+btsk),k=2,3,4
其中,最后一层的输出yj4即为Gts输出的映射后的表示向量e′(uj);
其中,所述步骤4包括:
步骤4.1、设计与所述第一生成器Gst对应的所述第一判别器Dt和与所述第二生成器Gts对应的所述第二判别器Ds为基础自编码器结构,建立所述第一判别器Dt和所述第二判别器Ds分别为两层的神经网络,每层的神经元数分别为d,2*d,d,通过随机取值得到初始化的第k层与第k+1层之间的权重向量Wtk,Wsk和偏置向量
步骤4.2、对于中的每个节点向量e(ui),循环执行第二步骤集;
步骤4.3、对于中的每个节点向量e(uj),循环执行第三步骤集;
所述第二步骤集包括:
步骤4.2.1、将e(ui)输入所述第二判别器Ds,通过Ds的逐层计算,得到其重构向量每一层的输出向量计算方式如下:
rik=σ(Wskrik-1+bsk),k=2,3,
其中,σ为sigmoid函数,最后一层的输出ri3即为Ds输出的节点重构向量
步骤4.2.2、基于随机梯度下降法,按最小化以下公式更新
其中,||·||为2-范数,相当于以自编码器的重构误差作为基于能量的所述第二判别器损失;
所述第三步骤集包括:
步骤4.3.1、将e(uj)输入所述第一判别器Dt,通过Dt的逐层计算,得到其重构向量每一层的输出向量计算方式如下:
rjk=σ(Wtkrjk-1+btk),k=2,3,
其中,最后一层的输出rj3即为Dt输出的节点重构向量
步骤4.3.2、基于随机梯度下降法,按最小化以下公式更新
其中,||·||为2-范数,相当于以自编码器的重构误差作为基于能量的所述第一判别器损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011131205.5/1.html,转载请声明来源钻瓜专利网。