[发明专利]一种基于多源交互融合的图表示学习方法在审
申请号: | 202210267016.3 | 申请日: | 2022-03-17 |
公开(公告)号: | CN114756713A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 朱东杰;孙云栋;张星东;丁卓 | 申请(专利权)人: | 哈尔滨工业大学(威海);南京龙垣信息科技有限公司 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06N3/04;G06N3/08 |
代理公司: | 苏州中合知识产权代理事务所(普通合伙) 32266 | 代理人: | 阮梅 |
地址: | 264333*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 交互 融合 图表 学习方法 | ||
本发明公开一种基于多源交互融合的图表示学习方法,包括如下步骤:提取图结构形式的网络中的节点属性、节点类别以及节点之间的邻接关系;采用基于BFS、DFS的元路径高阶邻域节点采样算法分别得到BFS和DFS高阶邻域节点集;通过一阶邻域信息聚合算法获取节点的一阶邻域信息;通过异质高阶邻域信息聚合算法获取节点的高阶领域信息;利用基于门控神经网络的多源信息融合模型将节点的自身信息、节点的高阶邻域信息以及一阶邻域信息进行融合得到节点的多源交互融合信息作为最终的向量表示;在多任务优化函数下对算法模型的参数进行优化。本发明提升了对元路径内节点信息提取能力,同时大大增强了对不同层次邻域信息的捕捉能力。
技术领域
本发明涉及图数据表示学习与图数据挖掘技术领域,尤其涉及一种基于多源交互融合的图表示学习方法。
背景技术
许多复杂的系统是以图结构的形式进行数据处理的,例如社交网络、生物网络和信息网络。众所周知,网络数据通常很复杂,因此难以处理,主要表现在高计算复杂性、低并行性和难以利用现有的机器学习、深度学习方法等方面。为了更有效的处理网络数据,首要的挑战就是找到高效的网络数据表示方法,使得下游的数据分析任务,如:数据挖掘、分析、预测等能够在有限的空间和时间上高效的进行。图表示学习作为一种十分具有前景的图结构数据表示方法,能够支持一系列的图数据处理和分析任务,如:图节点分类、图节点聚类、图可视化和节点连接关系预测等。相比传统的图数据表示,首先图表示学习能够将复杂的图数据节点及其关系在较低的维度进行向量化表示,达到了降维的目的,降低存储成本的同时提升计算效率;然后,在保留图数据结构和拓扑信息的同时能够去除噪声和冗余信息,提升对潜在数据特征的提取和挖掘能力;最重要的是节点与节点之间的距离能够衡量相互关系并且可以并行化计算和应用到前沿的机器学习、深度学习算法中去,能给大大扩宽其应用场景。因此,如何实现图结构数据的高效表示成为近期研究的热点问题,由此也衍生了图表示学习这一领域。另外,现实中的图节点自身的属性信息以及节点之间的关联关系复杂多样,如何对这些复杂的信息进行高效全面的挖掘和学习对于下游任务具有重要的研究价值。
目前的图表示学习方法在节点分类、链接预测、推荐系统、群体发现等领域取得了巨大成功,其中图神经网络(GNN)的出现使得网络表示学习的能力进一步得到提升。基于GNN的网络表示学习方法能够很好的聚合与中心节点直接相邻的节点的信息,但是目前基于GNN的方法无法在单层内对高阶邻居信息进行直接聚合,虽然能够通过多层迭代的方法对远距离的邻居信息进行聚合,但是这种方式复杂度较高且在迭代的过程中存在信息的间接损失和引入大量噪声信息等问题。另外,目前基于GNN的网络表示学习方法没有分层次充分考虑和区分节点之间的关系,而真实场景下节点之间不同层次和不同语义的关系对网络表示结果具有重要的影响。最后,目前在处理异质图数据的方法大都基于元路径策略,通过限定节点交互模式来提取不同的关系,但是目前的方法没有将元路径内节点纳入信息聚合中,例如:学术引文网络中的APA(A代表学者,P代表论文)用来挖掘出共同发表同一篇文章的两个学者,该元路径只关注两个学者,而不关注两个学者共同发表的文章信息,这将丢失大量的信息,进而影响对两个作者之间的关系的准确挖掘。
发明内容
为了解决现有图表示学习技术无法在单层内对高阶邻居信息进行直接聚合、没有分层次充分考虑和区分节点之间的关系以及在处理异质图数据的元路径信息时没有将元路径内节点纳入信息聚合中等问题,本发明提出一种基于多源交互融合的图表示学习方法。
为了达到上述目的,本发明的技术方案如下:
一种基于多源交互融合的图表示学习方法,包括如下步骤:
提取图结构形式的网络中的节点属性、节点类别以及节点之间的邻接关系;
基于节点之间的邻接关系将节点的邻居节点分为直接相邻的一阶邻域节点和非直接相邻的高阶邻域节点;
采用基于BFS的元路径高阶邻域节点采样算法得到BFS高阶邻域节点集;采用基于DFS的元路径高阶邻域节点采样算法得到DFS高阶邻域节点集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海);南京龙垣信息科技有限公司,未经哈尔滨工业大学(威海);南京龙垣信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210267016.3/2.html,转载请声明来源钻瓜专利网。