[发明专利]一种对复杂网络进行链路预测的方法有效
申请号: | 201811253235.6 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109214599B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 谷伟伟;高飞;张江 | 申请(专利权)人: | 北京师范大学;集智学园(北京)科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G16B5/00 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 网络 进行 预测 方法 | ||
1.一种对复杂网络进行链路预测的方法,包括模型的构建和其分批训练方法,其特征在于,包括:对网络拓扑结构预处理,得到分批训练数据集;建立基于GAT的端到端链路预测模型;对模型进行分批训练,得出模型参数;利用训练好的模型对连边进行预测,所述模型包含训练好的GAT模型和其后的二分类器模型,其方法具体如下:
1).对需要处理的目标网络进行消除方向消除权重处理,得到网络无向无权的同质拓扑结构,该网络不能包含孤立节点;
2).上述网络中连边对应的点对作为训练集中的正例,同时随机采集与连边数等量且没有连边的点对,作为训练集中的负例;对正负例中出现的所有点进行固定数目一阶、二阶邻居采样,节点和其邻居看做整体,然后将训练集分批;
3).构建基于GAT的端到端链路预测模型,包含以下部分:
3.1).模型输入为点对和它们的一阶、二阶邻居,输出为该点对之间有连边的概率;
3.2).根据网络数据实际情况,将节点向量采用随机向量初始化,其中i为节点下标;
3.3).节点向量在初始向量的基础上通过以下两层图注意力模型进行更新,第一层图注意力更新的公式具体为:
其中αij表示节点i对节点j的注意力,表示经过第一层GAT后节点的更新向量,参数a,W随机初始化赋值,a,W最终的取值由本算法优化所得,N(i)表示所有与节点i相连接的节点集合,k及j表示与i节点相连的某个节点;节点向量更新的具体做法为,首先根据节点的二阶邻居和一阶邻居的初始向量信息,分别并行更新一阶邻居和该节点的向量,然后利用更新之后的向量,经过第二层GAT,再次更新该节点的向量;
3.4).经过上述3.3)步骤得到点对的更新向量将向量组合,得到点对之间连边的向量eij,其中d表示节点的嵌入最高维度,组合方法如下:
3.5).将上述连边向量输入逻辑回归分类器,得到该连边存在的概率值;
4).模型的训练方法为:每次输入训练集中的一批点对,由3)中的步骤计算点对之间连边存在的概率值,将各点对概率值与真实连边相比,得到该模型参数情况下的损失值,计算损失值的平均值作为这批数据的损失值,并利用梯度下降算法对模型参数进行更新;
5).利用模型训练好的参数,对新的连边进行预测,包括:对于要预测的连边,输入该连边对应的点对,输入训练好的模型中,得到该点对之间存在连边的概率值P,若P≥0.5,则预测该连边存在,否则预测为不存在;
6).在3.3)所述注意力模型中,并行计算多个注意力权重分布,在3.3)的基础上包含以下步骤:
6.1).第一层计算K1个注意力分布,在此基础上采用平均的方式得到节点和其一阶邻居的更新向量,其中σ表示sigmoi函数,Wk表示第k层的参数向量,初始化为随机值,具体如下:
6.2).第二层计算K2个注意力分布,在此基础上采用拼接的方式得到节点的更新向量,具体如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学;集智学园(北京)科技有限公司,未经北京师范大学;集智学园(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811253235.6/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理