[发明专利]一种基于多阶邻近相似度的网络表示学习的方法有效
申请号: | 201811175451.3 | 申请日: | 2018-10-09 |
公开(公告)号: | CN109447261B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 姚文斌;张丽娟;丁元浩;杨超;樊悦芹 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06N3/0985 | 分类号: | G06N3/0985;G06F18/22;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 邻近 相似 网络 表示 学习 方法 | ||
1.一种基于多阶邻近相似度的网络表示学习的方法,其特征在于:
1)将实际的社交网络拓扑抽象化为无向图,无向图中的点表示社交网络中的用户节点,无向图中的边表示社交网络中的用户间关系;
2)根据网络中节点间的邻接关系,对每对节点进行相似度建模,其中相似度包括节点之间的直接相似度和间接相似度;
3)综合每个节点对的所有邻接关系,计算综合邻近相似度,存入每个节点的上下文节点集合中;
4)整合目标节点的所有直接或间接的上下文节点,通过skip-gram的方法输出目标节点的向量表示;
所述步骤1)包括:设无向图G=(V,E)表示网络拓扑结构,其中V表示用户节点,E表示连接关系;
所述步骤2)包括:节点对间的邻近关系包括两种:直接邻近和间接邻近,具体包括以下步骤:
2.1.基于一阶相似性的直接邻近
设(B,C)为目标节点对,若B与C有直接连边,则B,C之间的路径长度为1,路径长度为1的节点间的相似度对应为一阶相似度;
一阶邻近的计算方法:
PBC=UB·UC
2.2.基于二阶相似性的间接邻近
设(B,C)为目标节点对,若B和C之间没有直接连边,但B与C之间有公共的一阶邻居节点,即B与C的最短路径长度为2,则称B与C为二阶相连,B与C之间的相似度为二阶相似度;
二阶邻近的计算方法:
PBAC=WAB(UA·UB)+WAC(UA·UC)+αLBAC+βMA
2.3.基于高阶相似性的间接邻近
设(B,C)为目标节点对,若B和C之间的最短路径长度为k,其中k≥3,则B与C为k阶邻近;
三阶邻近的计算方法:
PBAC=WAB*(UB|UA)+WAC*(UA·UC)+αLBAC+βMA
K阶邻近的计算方法,其中k≥4:
PBAC=WAB(UB|UA)+WAC(UC|UA)+αLBAC+βMA
所述步骤3)包括:设(B,C)为目标节点对,B与C之间有多种邻近关系,NNk(B,C)代表B与C的k阶邻近度,则B与C之间的总体邻近度λ为超参数;
所述步骤4)包括:设每个节点A都有一个上下文节点集合SA,SA中的元素以键值对的形式存在,元素的键为节点A的上下文邻近节点,元素的值为A与该上下文节点间的关联度,以上公式中涉及到如下参数信息:
具体的实施步骤为:
(1)将真实的社交网络结构抽象为无向图G(V,E),其中V表示用户节点,E表示用户间关注与被关注关系;
(2)取出网络中的一个节点A,找出与其步长不超过k的邻近节点,并将这些节点放入A的上下文节点集SA中,每个节点都有一个对应的上下文节点集合,形式如下:
SA={[B:NNAB],[C:NNAC],....,[Q:NNAQ]},
其中,[]表示上下文节点元素,元素中的节点以键值对的形式存在,元素的键表示上下文节点的名称,元素的值为上下文节点与原节点的关联度;
(3)初始化节点A的上下文节点集SA中的每个节点与A的关联度为1;
(4)取出SA中的任意一个节点元素B,若节点B与节点A之间的路径长度为1,即直接相邻,通过下式计算关联度:
PAB=UA·UB
更新SA中相应的上下文节点的值,所述更新为加权;
(5)重复步骤(4),直至更新完毕SA中所有与节点A一阶相邻的节点的值;
(6)从集合SA中任意取出两个节点B和C,分别判断节点A与节点B和节点C之间的邻近距离,若B与C是经过A的二阶邻近,则执行步骤(7);若A与B是一阶邻近,A与C是k阶邻近,其中k≥2,则执行步骤(8);若A与B是k1阶邻近,A与C是k2阶邻近,其中k1,k2≥2,则执行步骤(9);
(7)通信节点A直接连接了目标节点B和C,即节点B和节点C是二阶邻近,通信节点A使得B与C之间通信的概率NN2如下式所示:
PBAC=WAB*(UA·UB)+WAC*(UA·UC)+αLBAC+βMA
其中Uj为节点j的one-hot向量表示,WAB为节点A与B之间的权重,Likj表示经通信节点k相连的节点i与j之间的路径距离,α为传播衰减系数,MA为节点A的影响力,用节点A的度数表示,β为通信节点A的节点影响力对BC关联度的偏置系数;
(8)通信节点A与目标节点B和C的距离为1和k,其中k≥2,通信节点A使得B与C之间通信的概率NNk+1如下式所示
PBAC=WAB*(UB·UA)+WAC*(UA|UC)+αLBAC+βMA
(9)通信节点A与目标节点B的距离为k1,与目标节点C的距离为k2,通信节点A使得B与C之间通信的概率NNk1+k2如下式所示
PBAC=WAB*(UB|UA)+WAC*(UC|UA)+αLBAC+βMA
(10)由(7)或(8)或(9)计算得到的间接邻近值更新SB和SC中的键为C和键为B的元素值,所述更新为加权;
(11)SA中的节点是否已被全部二次遍历,如果是,则执行步骤(12),如果否,则跳回步骤(6);
(12)选出与(2)中不重复的目标节点,执行步骤(2),直到网络拓扑中的所有节点都已被表示学习;
(13)通过skip-gram词向量的表示方法,将原节点A与上下文集合SA分别作为神经网络的输入和输出,学习到的参数即为节点A的表示向量;
(14)通过步骤(13)遍历得到网络中所有节点的表示向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811175451.3/1.html,转载请声明来源钻瓜专利网。