[发明专利]一种基于多阶邻近相似度的网络表示学习的方法有效
申请号: | 201811175451.3 | 申请日: | 2018-10-09 |
公开(公告)号: | CN109447261B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 姚文斌;张丽娟;丁元浩;杨超;樊悦芹 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06N3/0985 | 分类号: | G06N3/0985;G06F18/22;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种基于多阶邻近相似度的网络表示学习的方法。相比于传统的基于结构分析的网络表示只考虑了一阶邻近相似度和二阶邻近相似度的关系,本发明重点为节点间的高阶邻近相似度建模,分别设计了不同类别的间接邻近相似度的计算方法,尤其是考虑到了信息在网络传播过程中会随着距离的增加而衰减,因此,本发明能对当前节点的不同邻居节点进行预测,更加准确的找到与目标节点的关联度最大的邻近节点,从而能够得到语义更加丰富,具有更高的可靠性和真实性的表示向量。 | ||
搜索关键词: | 一种 基于 邻近 相似 网络 表示 学习 方法 | ||
【主权项】:
1.本文提供了一种基于多阶邻近相似度的网络表示学习的方法,其特征在于:1)将实际的社交网络拓扑抽象化为无向图,无向图中的点表示社交网络中的用户节点,无向图中的边表示社交网络中的用户间关系。2)根据网络中节点间的邻接关系,对每对节点进行相似度建模,其中相似度包括节点之间的直接相似度和间接相似度。3)综合每个节点对的所有邻接关系,计算综合邻近相似度,存入每个节点的上下文节点集合中。4)整合目标节点的所有直接或间接的上下文节点,通过skip‑gram的方法输出目标节点的向量表示。所述步骤1)包括:设无向图G=(V,E)表示网络拓扑结构,其中V表示用户节点,E表示连接关系。所述步骤2)包括:节点对间的邻近关系包括两种:直接邻近和间接邻近。具体包括以下步骤:2.1.基于一阶相似性的直接邻近设(B,C)为目标节点对,若B与C有直接连边,则B,C之间的路径长度为1,路径长度为1的节点间的相似度对应为一阶相似度。一阶邻近的计算方法:PBC=UB·UC2.2.基于二阶相似性的间接邻近网络一阶相似度刻画的是网络中有直接连边的节点间的局部特征,描述的信息具有片面性。且网络拓扑中的连边具有稀疏性特征,仅用直接连边的关系难以满足真实的节点趋同性关系。于是,有了二阶相似度的提出。设(B,C)为目标节点对,若B和C之间没有直接连边,但B与C之间有公共的一阶邻居节点,即B与C的最短路径长度为2,则称B与C为二阶相连,B与C之间的相似度为二阶相似度。二阶邻近的计算方法:PBAC=WAB(UA·UB)+WAC(UA·UC)+αLBAC+βMA2.3.基于高阶相似性的间接邻近在大规模网络中,节点之间的邻近关系只研究到二阶是远远不够的,一方面仍是具有稀疏性的问题,另一方面,路径长度为2的邻接关系难以刻画全局特征,于是,本专利提出了高阶邻近关系的刻画方法。设(B,C)为目标节点对,若B和C之间的最短路径长度为k(k>=3),则B与C为k阶邻近。三阶邻近的计算方法:PBAC=WAB*(UB|UA)+WAC*(UA·UC)+αLBAC+βMAK阶邻近的计算方法:(k≥4)PBAC=WAB(UB|UA)+WAC(UC|UA)+αLBAC+βMA所述步骤3)包括:设(B,C)为目标节点对,B与C之间有多种邻近关系,NNk(B,C)代表B与C的k阶邻近度,则B与C之间的总体邻近度所述步骤4)包括:设每个节点A都有一个上下文节点集合SA,SA中的元素以键值对的形式存在,元素的键为节点A的上下文邻近节点,元素的值为A与该上下文节点间的关联度。本发明中涉及到如下参数信息:具体的实施步骤为:(1)将真实的社交网络结构抽象为无向图G(V,E),其中V表示用户节点,E表示用户间关注与被关注关系。(2)取出网络中的一个节点A,找出与其步长不超过k的邻近节点,并将这些节点放入A的上下文节点集SA中。每个节点都有一个对应的上下文节点集合,形式如下:SA={[B:NNAB],[C:NNAC],....,[Q:NNAQ]},其中,[]表示上下文节点元素,元素中的节点以键值对的形式存在,元素的键表示上下文节点的名称,元素的值为上下文节点与原节点的关联度。(3)初始化节点A的上下文节点集SA中的每个节点与A的关联度为1。(4)取出SA中的任意一个节点元素B,若节点B与节点A之间的路径长度为1,即直接相邻,通过下式计算关联度。PAB=UA·UB更新SA中相应的上下文节点的值。(注意:更新不是赋值,是加权)(5)重复步骤(4),直至更新完毕SA中所有与节点A一阶相邻的节点的值。(6)从集合SA中任意取出两个节点B和C(第二次遍历),分别判断节点A与节点B和节点C之间的邻近距离,若B与C是经过A的二阶邻近,则执行步骤(7);若A与B(C)是一阶邻近,A与C(B)是k阶邻近,(k>=2),则执行步骤(8);若A与B是k1阶邻近,A与C是k2阶邻近,(k1,k2>=2),则执行步骤(9)。(7)通信节点A直接连接了目标节点B和C,即节点B和节点C是二阶邻近,通信节点A使得B与C之间通信的概率NN2如下式所示:PBAC=WAB*(UA·UB)+WAC*(UA·UC)+αLBAC+βMA其中Uj为节点j的one‑hot向量表示,WAB为节点A与B之间的权重,Likj表示经通信节点k相连的节点i与j之间的路径距离,α为传播衰减系数,MA为节点A的影响力,可以用节点A的度数表示,β为通信节点A的节点影响力对BC关联度的偏置系数。(8)通信节点A与目标节点B和C的距离为1和k,(k>=2),通信节点A使得B与C之间通信的概率NNk+1如下式所示PBAC=WAB*(UB·UA)+WAC*(UA|UC)+αLBAC+βMA(9)通信节点A与目标节点B的距离为k1,与目标节点C的距离为k2,通信节点A使得B与C之间通信的概率如下式所示PBAC=WAB*(UB|UA)+WAC*(UC|UA)+αLBAC+βMA(10)由(7)或(8)或(9)计算得到的间接邻近值更新SB和SC中的键为C和键为B的元素值。(注意:更新不是赋值,是加权)(11)SA中的节点是否已被全部二次遍历,如果是,则执行步骤(12),如果否,则跳回步骤(6)。(12)选出与(2)中不重复的目标节点,执行步骤(2),直到网络拓扑中的所有节点都已被表示学习。(13)通过skip‑gram词向量的表示方法,将原节点A与上下文集合SA分别作为神经网络的输入和输出,学习到的参数即为节点A的表示向量。(14)通过步骤(13)遍历得到网络中所有节点的表示向量。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811175451.3/,转载请声明来源钻瓜专利网。