[发明专利]基于超图卷积的超边链接预测方法有效
申请号: | 202011276695.8 | 申请日: | 2020-11-16 |
公开(公告)号: | CN112417219B | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 王英;杨伟英;王鑫;左万利;贾天浩;郝琳琳 | 申请(专利权)人: | 吉林大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06N3/04;G06N3/08 |
代理公司: | 长春市恒誉专利代理事务所(普通合伙) 22212 | 代理人: | 李荣武 |
地址: | 130012 吉*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 超图 卷积 链接 预测 方法 | ||
本发明公开了一种基于超图卷积的超边链接预测方法,旨在通过采用超边建模网络数据中的多元关联关系,实现潜在超边链接关系的预测,从而克服基于成对关系的网络数据进行研究的传统方法所带来的局限。该模型的步骤为:1.通过特征提取构建特征矩阵,将原始网络邻接矩阵转换为超图关联矩阵;2.融合超图卷积实现超图卷积自动编码器,将超图网络数据转换成一种低维空间表示;3.加入节点近邻度函数,最大程度的保留其结构信息;4.通过迭代优化获得鲁棒的隐层向量表示从而预测潜在的超边关联关系。
技术领域
本发明涉及一种基于超图卷积的超边预测方法,更具体地说,本发明涉及一种异质信息网络超边预测方法。
背景技术
网络是表达实体间联系的一种重要形式,真实世界的数据通常被组织成图结构的方式。图数据分析在数据挖掘任务中起着重要的作用,如链接预测。链接预测作为网络分析任务的重要问题之一,其目的在于预测网络中缺失的边,或者可能出现的边。这些任务适用于各种图数据,包括蛋白质-蛋白质相互作用网络、社交媒体和引文网络。然而,由于图数据分析具有较高的计算代价和较低的并行性,因此,处理图数据是一项具有挑战性的任务。
目前,基于网络表示学习实现链接预测任务主要有两类方法:基于同质信息网络的研究方法和基于异质信息网络的研究方法。在同质信息网络中,可以通过表示学习获得节点的低维向量表示,并以此来预测网络中是否存在链接。Perozzi等人提出的DeepWalk模型通过流式随机游走方法,利用通用的语言模型探究图结构。Grover等人在此基础上改进了随机游走过程,通过引入广度优先搜索策略和深度优先搜索策略,同时考虑了节点的局部和全局邻接特征,获得节点表示。这些方法直接学习节点的低维表示,但在获取丰富的邻域信息方面存在局限性。随着神经网络技术的普及,基于深度神经网络探索网络结构引起了学者们的关注。图神经网络(GNNs)利用深度神经网络对相邻节点的特征信息进行增强,提升了节点聚合嵌入的能力。Bruna等人将图卷积通过傅里叶变换拓展到图的频域中。Thomas等人在此基础上做了改进,使用谱图卷积(Spectral Graph Convolution)的局部一阶近似确定卷积结构,可以学习图上局部结构的特征,并进行编码。Velickovic等人在表示学习过程中引入了注意力机制,通过自注意力来衡量不同邻居的影响。然而,基于同质信息网络的表示学习方法在学习过程中,忽略了节点和边的类型。因此,基于同质信息网络表示的链接预测方法效果并不是很理想。在异质信息网络中,可以利用更多类型的节点信息,学习到更丰富的向量表示,并以此预测节点间是否存在链接。Wang等人提出SHINE模型解决异质信息网络中的情感链接预测问题,该模型利用多个深度自编码器学习节点的向量表示,并将其融合到同一空间用于情感链接预测。Fu等人提出Hin2vec模型基于随机游走同时学习节点和边的向量表示,并将学到的节点向量用于链接预测任务。Shang等人提出考虑多条路径信息学习节点的表示,该方法在面对具体问题时,无法学习到最优的权重组合。Wang等人提出HAN模型将注意力机制引入异质信息网络学习过程中,通过节点级别注意力区分一个节点在元路径上邻居节点的不同的重要性,语义级别注意力基于元路径将多种语义信息结合到一起,学习每条语义的权重,从而能够更好地学习到节点的表示用于链接预测任务。
另一方面,以上方法都假定对象之间的关系是成对的。它意味着每条边只连接两个节点。然而,在现实生活中对象实体之间的关系往往是较为复杂的单对多或者多对多的多元关联关系,例如,在社交网络中,用户对电影进行评价,将用户、电影和标签作为节点,用户的评价看作一个事件作为图的边,每条边可以连接两个以上的节点。在这种情况下,其关系不再是二元的(成对的),而是三元、四元或更多元的。在解决该类问题时,如果简单的把多元关系强制转换为二元关联关系,那么将会丢失很多有用的信息。由此引出超图的概念,利用超边同时连接多个节点的特殊图网络。如Facebook和新浪微博等构成的社交网络,用户之间的关系复杂多样,可能包含多个实体,如果仅将其建模为两两节点之间的链接关系,那么将会忽略很多复杂关联关系的信息,因此,通过超边定义三个或三个以上实体构成的关系,形成超图,从而预测节点间存在的超边链接关系十分重要。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011276695.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泥浆漏失风险评估方法及装置
- 下一篇:一种新型防火排烟阀门