[发明专利]一种基于多阶邻近相似度的网络表示学习的方法有效

专利信息
申请号: 201811175451.3 申请日: 2018-10-09
公开(公告)号: CN109447261B 公开(公告)日: 2023-08-04
发明(设计)人: 姚文斌;张丽娟;丁元浩;杨超;樊悦芹 申请(专利权)人: 北京邮电大学
主分类号: G06N3/0985 分类号: G06N3/0985;G06F18/22;G06Q50/00
代理公司: 暂无信息 代理人: 暂无信息
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 邻近 相似 网络 表示 学习 方法
【权利要求书】:

1.一种基于多阶邻近相似度的网络表示学习的方法,其特征在于:

1)将实际的社交网络拓扑抽象化为无向图,无向图中的点表示社交网络中的用户节点,无向图中的边表示社交网络中的用户间关系;

2)根据网络中节点间的邻接关系,对每对节点进行相似度建模,其中相似度包括节点之间的直接相似度和间接相似度;

3)综合每个节点对的所有邻接关系,计算综合邻近相似度,存入每个节点的上下文节点集合中;

4)整合目标节点的所有直接或间接的上下文节点,通过skip-gram的方法输出目标节点的向量表示;

所述步骤1)包括:设无向图G=(V,E)表示网络拓扑结构,其中V表示用户节点,E表示连接关系;

所述步骤2)包括:节点对间的邻近关系包括两种:直接邻近和间接邻近,具体包括以下步骤:

2.1.基于一阶相似性的直接邻近

设(B,C)为目标节点对,若B与C有直接连边,则B,C之间的路径长度为1,路径长度为1的节点间的相似度对应为一阶相似度;

一阶邻近的计算方法:

PBC=UB·UC

2.2.基于二阶相似性的间接邻近

设(B,C)为目标节点对,若B和C之间没有直接连边,但B与C之间有公共的一阶邻居节点,即B与C的最短路径长度为2,则称B与C为二阶相连,B与C之间的相似度为二阶相似度;

二阶邻近的计算方法:

PBAC=WAB(UA·UB)+WAC(UA·UC)+αLBAC+βMA

2.3.基于高阶相似性的间接邻近

设(B,C)为目标节点对,若B和C之间的最短路径长度为k,其中k≥3,则B与C为k阶邻近;

三阶邻近的计算方法:

PBAC=WAB*(UB|UA)+WAC*(UA·UC)+αLBAC+βMA

K阶邻近的计算方法,其中k≥4:

PBAC=WAB(UB|UA)+WAC(UC|UA)+αLBAC+βMA

所述步骤3)包括:设(B,C)为目标节点对,B与C之间有多种邻近关系,NNk(B,C)代表B与C的k阶邻近度,则B与C之间的总体邻近度λ为超参数;

所述步骤4)包括:设每个节点A都有一个上下文节点集合SA,SA中的元素以键值对的形式存在,元素的键为节点A的上下文邻近节点,元素的值为A与该上下文节点间的关联度,以上公式中涉及到如下参数信息:

具体的实施步骤为:

(1)将真实的社交网络结构抽象为无向图G(V,E),其中V表示用户节点,E表示用户间关注与被关注关系;

(2)取出网络中的一个节点A,找出与其步长不超过k的邻近节点,并将这些节点放入A的上下文节点集SA中,每个节点都有一个对应的上下文节点集合,形式如下:

SA={[B:NNAB],[C:NNAC],....,[Q:NNAQ]},

其中,[]表示上下文节点元素,元素中的节点以键值对的形式存在,元素的键表示上下文节点的名称,元素的值为上下文节点与原节点的关联度;

(3)初始化节点A的上下文节点集SA中的每个节点与A的关联度为1;

(4)取出SA中的任意一个节点元素B,若节点B与节点A之间的路径长度为1,即直接相邻,通过下式计算关联度:

PAB=UA·UB

更新SA中相应的上下文节点的值,所述更新为加权;

(5)重复步骤(4),直至更新完毕SA中所有与节点A一阶相邻的节点的值;

(6)从集合SA中任意取出两个节点B和C,分别判断节点A与节点B和节点C之间的邻近距离,若B与C是经过A的二阶邻近,则执行步骤(7);若A与B是一阶邻近,A与C是k阶邻近,其中k≥2,则执行步骤(8);若A与B是k1阶邻近,A与C是k2阶邻近,其中k1,k2≥2,则执行步骤(9);

(7)通信节点A直接连接了目标节点B和C,即节点B和节点C是二阶邻近,通信节点A使得B与C之间通信的概率NN2如下式所示:

PBAC=WAB*(UA·UB)+WAC*(UA·UC)+αLBAC+βMA

其中Uj为节点j的one-hot向量表示,WAB为节点A与B之间的权重,Likj表示经通信节点k相连的节点i与j之间的路径距离,α为传播衰减系数,MA为节点A的影响力,用节点A的度数表示,β为通信节点A的节点影响力对BC关联度的偏置系数;

(8)通信节点A与目标节点B和C的距离为1和k,其中k≥2,通信节点A使得B与C之间通信的概率NNk+1如下式所示

PBAC=WAB*(UB·UA)+WAC*(UA|UC)+αLBAC+βMA

(9)通信节点A与目标节点B的距离为k1,与目标节点C的距离为k2,通信节点A使得B与C之间通信的概率NNk1+k2如下式所示

PBAC=WAB*(UB|UA)+WAC*(UC|UA)+αLBAC+βMA

(10)由(7)或(8)或(9)计算得到的间接邻近值更新SB和SC中的键为C和键为B的元素值,所述更新为加权;

(11)SA中的节点是否已被全部二次遍历,如果是,则执行步骤(12),如果否,则跳回步骤(6);

(12)选出与(2)中不重复的目标节点,执行步骤(2),直到网络拓扑中的所有节点都已被表示学习;

(13)通过skip-gram词向量的表示方法,将原节点A与上下文集合SA分别作为神经网络的输入和输出,学习到的参数即为节点A的表示向量;

(14)通过步骤(13)遍历得到网络中所有节点的表示向量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811175451.3/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top