[发明专利]一种基于循环一致性对抗学习的用户身份对齐方法有效

申请号：	202011131205.5	申请日：	2020-10-21
公开（公告）号：	CN112508724B	公开（公告）日：	2022-03-11
发明（设计）人：	潘理;郑聪惠;王晓燕	申请（专利权）人：	上海交通大学
主分类号：	G06Q50/00	分类号：	G06Q50/00;G06K9/62;G06N3/04
代理公司：	上海旭诚知识产权代理有限公司 31220	代理人：	郑立
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于循环一致性对抗学习用户身份对齐方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于循环一致性对抗学习的用户身份对齐方法，其特征在于，包括以下步骤：

步骤1、输入源网络与目标网络以及表示向量的维度d，其中，分别为源网络和目标网络的用户节点集合，分别为源网络和目标网络的属性节点集合，ε^s,ε^t分别为源网络和目标网络的节点连边集合，ε^s＝{ε_uu^s,ε_ua^s},ε^t＝{ε_uu^t,ε_ua^t}，其中，ε_uu^s,ε_uu^t分别表示源网络和目标网络的用户节点之间的连边集合，ε_ua^s,ε_ua^t分别表示源网络和目标网络的用户节点和属性节点之间的连边集合；

步骤2、学习所述源网络节点表示向量与所述目标网络节点表示向量

步骤3、基于第一生成器G_st将所述源网络表示向量映射到目标网络表示空间即对于每个所述源网络节点向量基于所述第一生成器G_st得到e′(u_i)＝G_st(e(u_i))；基于第二生成器G_ts将目标网络表示向量映射到源网络表示空间即对于每个所述目标网络节点向量基于所述第二生成器G_ts得到e′(u_j)＝G_ts(e(u_j))；

步骤4、建立与所述第一生成器G_st对应的第一判别器D_t、与所述第二生成器G_ts对应的第二判别器D_s，所述第一判别器和所述第二判别器均设计为能量函数，D_t基于进行预训练得到初始化参数，D_s基于进行预训练得到初始化参数；

步骤5、对于所述源网络和所述目标网络每个节点的表示向量e(u^s),e(u^t)，循环执行步骤6到10；

步骤6、所述第一生成器G_st和所述第一判别器D_t之间进行基于能量的对抗学习，D_t按照最小化以下公式更新其权重

其中，m为实现定义的上限阈值；

步骤7、所述第一生成器G_st按照最小化以下公式更新其权重

步骤8、所述第二生成器G_ts和所述第二判别器D_s之间进行基于能量的对抗学习，D_s按照最小化以下公式更新其权重

步骤9、所述第二生成器G_ts按照最小化以下公式更新其权重

步骤10、所述第一生成器G_st与所述第二生成器G_ts之间进行循环一致性学习，

基于梯度下降法按照最小化第三公式更新权重向量和偏置向量；

所述第三公式为：

其中，d(·)为余弦距离函数；

步骤11、对于所述源网络中任意节点按照步骤12到14得到其在所述目标网络中的对应的锚用户

步骤12、基于所述第一生成器G_st得到的表示向量在所述目标网络中的映射向量

步骤13、计算与所述目标网络中每个节点向量的余弦相似度，按降序进行排序；

步骤14、取相似度最大的30个目标网络节点，若数据集中包含用户名属性，则将所述相似度最大的30个目标网络节点和分别进行用户名比对，用户名最相似的节点为在所述目标网络中的对应锚用户，若所述数据集中不包含用户名属性，则取相似度最大的节点作为在目标网络中的对应锚用户；

其中，所述步骤3包括：

步骤3.1、建立所述第一生成器G_st和所述第二生成器G_ts，它们分别为三层的神经网络，每层的神经元数分别为d,d+400,d+800,d，通过随机取值得到初始化的第k层与第k+1层之间的权重向量和偏置向量

步骤3.2、将中的节点向量e(u_i)依次输入所述第一生成器G_st，通过G_st的逐层计算，得到所述节点向量e(u_i)在目标网络表示空间中的映射向量e′(u_i)，每一层的输出向量计算方式如下：

y_i^k＝σ(W_st^ky_i^k-1+b_st^k),k＝2,3,4，

其中，σ为sigmoid函数，最后一层的输出y_i⁴即为G_st输出的映射后的表示向量e′(u_i)；

步骤3.3、将中的节点向量e(u_j)依次输入所述第二生成器G_ts，通过G_ts的逐层计算，得到其在源网络表示空间中的映射向量e′(u_j)，每一层的输出向量计算方式如下：

y_j^k＝σ(W_ts^ky_j^k-1+b_ts^k),k＝2,3,4

其中，最后一层的输出y_j⁴即为G_ts输出的映射后的表示向量e′(u_j)；

其中，所述步骤4包括：

步骤4.1、设计与所述第一生成器G_st对应的所述第一判别器D_t和与所述第二生成器G_ts对应的所述第二判别器D_s为基础自编码器结构，建立所述第一判别器D_t和所述第二判别器D_s分别为两层的神经网络，每层的神经元数分别为d,2*d,d，通过随机取值得到初始化的第k层与第k+1层之间的权重向量W_t^k,W_s^k和偏置向量

步骤4.2、对于中的每个节点向量e(u_i)，循环执行第二步骤集；

步骤4.3、对于中的每个节点向量e(u_j)，循环执行第三步骤集；

所述第二步骤集包括：

步骤4.2.1、将e(u_i)输入所述第二判别器D_s，通过D_s的逐层计算，得到其重构向量每一层的输出向量计算方式如下：

r_i^k＝σ(W_s^kr_i^k-1+b_s^k),k＝2,3，

其中，σ为sigmoid函数，最后一层的输出r_i³即为D_s输出的节点重构向量

步骤4.2.2、基于随机梯度下降法，按最小化以下公式更新

其中，||·||为2-范数，相当于以自编码器的重构误差作为基于能量的所述第二判别器损失；

所述第三步骤集包括：

步骤4.3.1、将e(u_j)输入所述第一判别器D_t，通过D_t的逐层计算，得到其重构向量每一层的输出向量计算方式如下：

r_j^k＝σ(W_t^kr_j^k-1+b_t^k),k＝2,3，

其中，最后一层的输出r_j³即为D_t输出的节点重构向量