[发明专利]基于特征累加的图卷积网络半监督节点分类方法在审
申请号: | 202210412198.9 | 申请日: | 2022-04-19 |
公开(公告)号: | CN114842247A | 公开(公告)日: | 2022-08-02 |
发明(设计)人: | 郭凌;张伟名;许鹏飞;朱文娟;柏恒 | 申请(专利权)人: | 西北大学 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 李郑建 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 特征 累加 图卷 网络 监督 节点 分类 方法 | ||
本发明公开了一种基于特征累加的图卷积网络半监督节点分类方法,该方法利用图卷积和K阶邻近性来获得更大的感受野,以获取更高层次邻域的节点特征,而后将不同邻域获得的节点信息进行融合,保全节点特征信息,具体包括:提出一个由不同层次图卷积网络组成的模型,每个层次提供不同的传播效率,第K个层次包含图上随机游走的第K步的节点特征信息;根据概率转移矩阵定义高次邻接矩阵,作为不同阶层的邻接矩阵来聚合不同邻域的节点特征信息,将不同步长的节点分别进行卷积操作,得到卷积后新的输出表示;将不同邻域范围的节点卷积后得到的新的特征表示利用融合函数进行混合,得到混合邻域的特征表示,利用分类器进行分类,得到最终的输出。
技术领域
本发明属于网络技术领域,涉及半监督节点分类,特别涉及一种基于特征累加的图卷积网络半监督节点分类方法。
背景技术
互联网的发展开启了大数据时代,产生了巨量的图结构数据。图数据结构复杂,不仅携带自身的属性信息,还有彼此相互作用的连接信息。图数据具有很强的表示复杂结构的能力,能够有效表达数据实体和它们之间潜在的空间关系。近年来,对图这种结构型数据的研究极大地促进了它们在不同任务领域的应用,包括社交网络、量子化学、交通预测等。例如在生物学上蛋白质之间的相互作用,通过将药物和蛋白质靶点相互作用建模为图结构,可以用来预测多种药物的副作用,在药物发现中有着重要的应用;在交通预测中,通过空间相关性建模的图结构可以预测交通流量情况,对改善交通压力提供了技术支持。图的应用越来越广泛,使得人们迫切需要寻找更高效更准确的方式进行数据处理。
图卷积网络(Graph Convolutional Network,GCN)的出现填补了图数据在处理方面的空白,随着技术的不断进步,出现了各种各样的图卷积网络变体,在处理图结构数据方面展现出了越来越好的性能。虽然图卷积网络在构建图结构数据方面表现出了良好的性能,但是由于每一层都有固定的感受野,图卷积网络无法获得能够提高性能的多层次邻域节点特性。在现有的一些研究当中,在聚合邻域节点信息的时候往往只考虑了二阶或三阶的邻域,对于高阶邻域来说,往往无法有效提取。因为大多数现有的基于谱域的图卷积网络通过叠加多个图卷积层来增强其特征提取能力,但是当模型变深时,它通常会导致特征稀释以及过度拟合问题。目前现有的图卷积网络模型中,例如GCN,它首次提出了解决图数据的模型,经过多种近似之后,GCN变成了一个一阶或二阶模型,若要处理K阶邻居,可以采用多层卷积来实现,但是这又产生了另外一个问题:随着K的增加,网络会变得非常复杂,参数过多;另外它利用了切比雪夫多项式近似,层数过多会导致特征过度平滑。这样就无法获取到高阶邻域的节点信息,导致节点的信息难以保全。对于注意力机制来说,它采用的是逐节点的计算方式,计算邻域不同节点的注意力系数,这样的计算方式可以很好地保全节点的信息,但是其特殊的计算方式导致算法复杂度过高,计算时间长,内存占用大。
因此,需要寻求一种方式,来保全节点信息的同时还能够兼顾算法效率。Xu等人发表的一篇名为《Representation Learning on Graphs with Jumping KnowledgeNetworks》的论文中,曾解释过图卷积网络中节点特征的传播方式,节点i的信息以类似的随机游走的方式传播到节点j,这意味着路径是特征传输的方式,感受野的大小由图中路径的长度决定。在图结构中,长路径只存在于几个点之间,这有利于获取全局特征,并且无向图中的感受野(路径)相对比较平衡。受图像分类初始网络的启发,一些模型拓展了它们的层次以获得更大的感受野并提高学习能力,但是它们在每层中都使用固定的邻接矩阵,这增加了捕获不同层次节点特征的难度。
发明内容
针对上述现有技术中存在的缺陷或不足,本发明的目的在于,提供一种基于特征累加的图卷积网络半监督节点分类方法。
为了实现上述任务,本发明采取如下的技术解决方案:
一种基于特征累加的图卷积网络半监督节点分类方法,其特征在于,该方法利用图卷积和K阶邻近性来获得更大的感受野,以获取更高层次邻域的节点特征,而后将不同邻域获得的节点信息进行融合,保全节点特征信息,具体包括下列步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210412198.9/2.html,转载请声明来源钻瓜专利网。