[发明专利]一种基于嵌入表示的跨网络账户关联方法有效
申请号: | 201910373894.1 | 申请日: | 2019-05-07 |
公开(公告)号: | CN110097125B | 公开(公告)日: | 2022-10-14 |
发明(设计)人: | 马江涛;乔亚琼;王艳军;李祖贺;吴怀广;张宏坡;尚松涛;陶红伟 | 申请(专利权)人: | 郑州轻工业学院;郑州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;H04L51/52 |
代理公司: | 郑州德勤知识产权代理有限公司 41128 | 代理人: | 黄红梅 |
地址: | 450000 *** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 嵌入 表示 网络 账户 关联 方法 | ||
1.一种基于嵌入表示的跨网络账户关联方法,其特征在于,包括以下步骤:
步骤1,分别提取源社交网络和目标社交网络中每个用户账户的用户生成内容特征向量和社交网结构特征向量,所述用户生成内容特征向量包括用户画像特征向量和用户文本特征向量;
步骤2,使用向量拼接的方法依次将源社交网络和目标社交网络中每个用户账户的用户生成内容特征向量与社交网结构特征向量进行拼接,获得拼接向量;
步骤3,遍历目标社交网络中的所有用户账户,将目标社交网络中的每个用户账户依次与源社交网络中的每个用户账户组成候选用户账户对,并根据拼接向量计算每个候选用户账户对的余弦相似度;
步骤4,按照余弦相似度值由大到小的顺序对所有候选用户账户对进行排序,建立相似度偏好列表;
步骤5,根据相似度偏好列表依次预测两个社交网络中的候选用户账户对是否为锚链接用户对。
2.根据权利要求1所述的基于嵌入表示的跨网络账户关联方法,其特征在于,步骤5具体包括以下步骤:
步骤5.1,将锚链接用户对集合M初始化为空集合;
步骤5.2,根据账户拼接向量的余弦相似度值初始化目标社交网络中的每个用户账户所对应的候选用户账户对之间所有边的权重;
步骤5.3,根据相似度偏好列表,使用带权二部图匹配算法逐一判断目标社交网络中的每个用户账户所对应的候选用户账户对是否为锚链接用户对;
步骤5.4,将已经匹配好的锚链接用户对添加到锚链接用户对集合M中,并将对应的锚链接用户分别从源社交网络和目标社交网络中删除。
3.根据权利要求2所述的基于嵌入表示的跨网络账户关联方法,其特征在于,步骤5.3中,根据相似度偏好列表,使用带权二部图匹配算法逐一判断目标社交网络中的每个用户账户所对应的候选用户账户对是否为锚链接用户对时,若某个候选用户账户对的边权值和为1,则该候选用户账户对即为锚链接用户对,若某个候选用户账户对的边权值和为0,则该候选用户账户对不是锚链接用户对。
4.根据权利要求1所述的基于嵌入表示的跨网络账户关联方法,其特征在于:
步骤1中,将用户账户的个人注册信息送入至Doc2Vec文本深度表示模型中,经Doc2Vec文本深度表示模型的训练获得每个用户账户的用户画像特征向量;将用户的推文信息送入至Doc2Vec文本深度表示模型中,经Doc2Vec文本深度表示模型的训练获得每个用户账户的用户文本特征向量;所述个人注册信息包括登录名、昵称、所在地、性别、生日、简介、教育信息、职业信息、联系信息以及标签信息等。
5.根据权利要求1所述的基于嵌入表示的跨网络账户关联方法,其特征在于:步骤1中,将用户账户的社交拓扑结构送入至网络嵌入表示模型中,经网络嵌入表示模型的训练获得用户账户的社交网络结构特征向量:
首先把每个节点映射到低维嵌入向量空间:ENC(v)=Zv,Zv为d维嵌入空间,v为网络中的节点,两个网络中的节点u、v在d维嵌入空间的结构相似性,如下式所示:
其中similarity(u,v)表示u、v在网络中的结构相似性,右式表示u、v在嵌入空间中的向量的点积;
使用随机游走策略R对每个节点u的邻居进行采样得到NR(u),根据下式优化嵌入向量:
优化嵌入空间使随机游走访问的网络节点出现的概率最大化,使用下面的softmax对P(v|zu)进行调参,从而预测u和v在随机游走中共现的概率:
把此共现概率代入到上式中,得到:
采用负采样的方法近似获得节点的相似性:
其中为sigmoid函数,ni~PV为所有节点的随机分布。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州轻工业学院;郑州大学,未经郑州轻工业学院;郑州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910373894.1/1.html,转载请声明来源钻瓜专利网。