[发明专利]一种对复杂网络进行链路预测的方法有效
申请号: | 201811253235.6 | 申请日: | 2018-10-25 |
公开(公告)号: | CN109214599B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 谷伟伟;高飞;张江 | 申请(专利权)人: | 北京师范大学;集智学园(北京)科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/00;G16B5/00 |
代理公司: | 江苏海越律师事务所 32402 | 代理人: | 唐小红 |
地址: | 100000 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供了一种对复杂网络进行链路预测的方法,基于图注意力网络(GAT)的端到端链路预测模型,以及该模型的分批训练方法。该模型的关键在于学习网络节点对周围邻居的注意力分布。模型的训练和利用模型预测的步骤包括:步骤一,输入无权无向同质网络的拓扑结构;步骤二,根据训练集的拓扑结构对所有节点进行一阶、二阶邻居采样,以便将网络分批;步骤三,将分批后的训练集输入上述模型训练出模型参数;步骤四,输入想要预测的点对,模型输出该点对之间有连边的概率。本发明所述模型具有端到端的特点。分批训练方法使得该模型对大规模复杂网络也适用。 | ||
搜索关键词: | 一种 复杂 网络 进行 预测 方法 | ||
【主权项】:
1.一种对复杂网络进行链路预测的方法,包括模型的构建和其分批训练方法,其特征在于,包括:对网络拓扑结构预处理,得到分批训练数据集;建立基于GAT的端到端链路预测模型;对模型进行分批训练,得出模型参数;利用训练好的模型对连边进行预测,所述模型包含训练好的GAT模型和其后的二分类器模型,其方法具体如下:1).对需要处理的目标网络进行消除方向消除权重处理,得到网络无向无权的同质拓扑结构,该网络不能包含孤立节点;2).上述网络中连边对应的点对作为训练集中的正例,同时随机采集与连边数等量且没有连边的点对,作为训练集中的负例;对正负例中出现的所有点进行固定数目一阶、二阶邻居采样,节点和其邻居看做整体,然后将训练集分批;3).构建基于GAT的端到端链路预测模型,包含以下部分:3.1).模型输入为点对和他们的一阶、二阶邻居,输出为该点对之间有连边的概率;3.2).根据网络数据实际情况,初始化节点向量为,其中i为节点下标;3.3).节点向量在初始向量的基础上通过以下两层图注意力模型进行更新,第一层图注意力更新的公式具体为:其中αij表示节点i对节点j的注意力,表示经过第一层GAT后节点的更新向量;节点向量更新的具体做法为,首先根据节点的二阶邻居和一阶邻居的初始向量信息,分别并行更新一阶邻居和该节点的向量,然后利用更新之后的向量,经过第二层GAT,再次更新该节点的向量;3.4).经过上述3.3)步骤得到点对的更新向量将向量组合,得到点对之间连边的向量eij,组合方法如下:3.5).将上述连边向量输入逻辑回归分类器,得到该连边存在的概率值;4).模型的训练方法为:每次输入训练集中的一批点对,由3)中的步骤计算点对之间连边存在的概率值,将各点对概率值与真实连边相比,得到该模型参数情况下的损失值,计算损失值的平均值作为这批数据的损失值,并利用梯度下降算法对模型参数进行更新;5).利用模型训练好的参数,对新的连边进行预测,包括:对于要预测的连边,输入该连边对应的点对,输入训练好的模型中,得到该点对之间存在连边的概率值P,若P≥0.5,则预测该连边存在,否则预测为不存在;6).在3.3)所述注意力模型中,并行计算多个注意力权重分布,在3.3)的基础上包含以下步骤:6.1).第一层计算K1个注意力分布,在此基础上采用平均的方式得到节点和其一阶邻居的更新向量,具体如下:6.2).第二层计算K2个注意力分布,在此基础上采用拼接的方式得到节点的更新向量,具体如下:
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京师范大学;集智学园(北京)科技有限公司,未经北京师范大学;集智学园(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811253235.6/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理