[发明专利]一种基于多阶邻近相似度的网络表示学习的方法有效

申请号：	201811175451.3	申请日：	2018-10-09
公开（公告）号：	CN109447261B	公开（公告）日：	2023-08-04
发明（设计）人：	姚文斌;张丽娟;丁元浩;杨超;樊悦芹	申请（专利权）人：	北京邮电大学
主分类号：	G06N3/0985	分类号：	G06N3/0985;G06F18/22;G06Q50/00
代理公司：	暂无信息	代理人：	暂无信息
地址：	100876 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于邻近相似网络表示学习方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多阶邻近相似度的网络表示学习的方法，其特征在于：

1)将实际的社交网络拓扑抽象化为无向图，无向图中的点表示社交网络中的用户节点，无向图中的边表示社交网络中的用户间关系；

2)根据网络中节点间的邻接关系，对每对节点进行相似度建模，其中相似度包括节点之间的直接相似度和间接相似度；

3)综合每个节点对的所有邻接关系，计算综合邻近相似度，存入每个节点的上下文节点集合中；

4)整合目标节点的所有直接或间接的上下文节点，通过skip-gram的方法输出目标节点的向量表示；

所述步骤1)包括：设无向图G＝(V,E)表示网络拓扑结构，其中V表示用户节点，E表示连接关系；

所述步骤2)包括：节点对间的邻近关系包括两种：直接邻近和间接邻近，具体包括以下步骤：

2.1.基于一阶相似性的直接邻近

设(B,C)为目标节点对，若B与C有直接连边，则B,C之间的路径长度为1，路径长度为1的节点间的相似度对应为一阶相似度；

一阶邻近的计算方法：

P_BC＝U_B·U_C

2.2.基于二阶相似性的间接邻近

设(B,C)为目标节点对，若B和C之间没有直接连边，但B与C之间有公共的一阶邻居节点，即B与C的最短路径长度为2，则称B与C为二阶相连，B与C之间的相似度为二阶相似度；

二阶邻近的计算方法：

P_BAC＝W_AB(U_A·U_B)+W_AC(U_A·U_C)+αL_BAC+βM_A

2.3.基于高阶相似性的间接邻近

设(B,C)为目标节点对，若B和C之间的最短路径长度为k，其中k≥3，则B与C为k阶邻近；

三阶邻近的计算方法：

P_BAC＝W_AB*(U_B|U_A)+W_AC*(U_A·U_C)+αL_BAC+βM_A

K阶邻近的计算方法，其中k≥4：

P_BAC＝W_AB(U_B|U_A)+W_AC(U_C|U_A)+αL_BAC+βM_A

所述步骤3)包括：设(B,C)为目标节点对，B与C之间有多种邻近关系，NN_k(B,C)代表B与C的k阶邻近度，则B与C之间的总体邻近度λ为超参数；

所述步骤4)包括：设每个节点A都有一个上下文节点集合S_A，S_A中的元素以键值对的形式存在，元素的键为节点A的上下文邻近节点，元素的值为A与该上下文节点间的关联度，以上公式中涉及到如下参数信息：

具体的实施步骤为：

(1)将真实的社交网络结构抽象为无向图G(V,E),其中V表示用户节点，E表示用户间关注与被关注关系；

(2)取出网络中的一个节点A，找出与其步长不超过k的邻近节点，并将这些节点放入A的上下文节点集S_A中，每个节点都有一个对应的上下文节点集合，形式如下：

S_A＝{[B:NN_AB],[C:NN_AC],....,[Q:NN_AQ]}，

其中，[]表示上下文节点元素，元素中的节点以键值对的形式存在，元素的键表示上下文节点的名称，元素的值为上下文节点与原节点的关联度；

(3)初始化节点A的上下文节点集S_A中的每个节点与A的关联度为1；

(4)取出S_A中的任意一个节点元素B，若节点B与节点A之间的路径长度为1，即直接相邻，通过下式计算关联度：

P_AB＝U_A·U_B

更新S_A中相应的上下文节点的值，所述更新为加权；

(5)重复步骤(4)，直至更新完毕S_A中所有与节点A一阶相邻的节点的值；

(6)从集合S_A中任意取出两个节点B和C，分别判断节点A与节点B和节点C之间的邻近距离，若B与C是经过A的二阶邻近，则执行步骤(7)；若A与B是一阶邻近，A与C是k阶邻近，其中k≥2,则执行步骤(8)；若A与B是k1阶邻近，A与C是k2阶邻近，其中k1,k2≥2,则执行步骤(9)；

(7)通信节点A直接连接了目标节点B和C，即节点B和节点C是二阶邻近，通信节点A使得B与C之间通信的概率NN₂如下式所示：

P_BAC＝W_AB*(U_A·U_B)+W_AC*(U_A·U_C)+αL_BAC+βM_A

其中U_j为节点j的one-hot向量表示，W_AB为节点A与B之间的权重，L_ikj表示经通信节点k相连的节点i与j之间的路径距离，α为传播衰减系数，M_A为节点A的影响力，用节点A的度数表示，β为通信节点A的节点影响力对BC关联度的偏置系数；

(8)通信节点A与目标节点B和C的距离为1和k，其中k≥2，通信节点A使得B与C之间通信的概率NN_k+1如下式所示

P_BAC＝W_AB*(U_B·U_A)+W_AC*(U_A|U_C)+αL_BAC+βM_A

(9)通信节点A与目标节点B的距离为k₁，与目标节点C的距离为k₂，通信节点A使得B与C之间通信的概率NN_k1+k2如下式所示

P_BAC＝W_AB*(U_B|U_A)+W_AC*(U_C|U_A)+αL_BAC+βM_A

(10)由(7)或(8)或(9)计算得到的间接邻近值更新S_B和S_C中的键为C和键为B的元素值，所述更新为加权；

(11)S_A中的节点是否已被全部二次遍历，如果是，则执行步骤(12)，如果否，则跳回步骤(6)；

(12)选出与(2)中不重复的目标节点，执行步骤(2)，直到网络拓扑中的所有节点都已被表示学习；

(13)通过skip-gram词向量的表示方法，将原节点A与上下文集合S_A分别作为神经网络的输入和输出，学习到的参数即为节点A的表示向量；

(14)通过步骤(13)遍历得到网络中所有节点的表示向量。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京邮电大学，未经北京邮电大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201811175451.3/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于深度学习的局地数值天气预报产品订正方法
下一篇：一种CPU与GPU协同执行算法优化的方法和相关装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于多阶邻近相似度的网络表示学习的方法有效

专利文献下载