[发明专利]基于图神经网络的社区发现方法在审
申请号: | 202310043047.5 | 申请日: | 2023-01-29 |
公开(公告)号: | CN116304773A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 施振佺;王博文;施佺;罗奇才;张翁坚;黄子玲;冯季;孙凡 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/2135;G06N3/042;G06N3/045 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 秦秋星 |
地址: | 226019 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 社区 发现 方法 | ||
1.一种基于图神经网络的社区发现方法,其特征在于,所述方法包括如下步骤:
步骤1:对初始数据进行预处理,将图中的节点信息转换成one-hot向量作为初始特征值,并拆分数据集;
步骤2:对one-hot向量进行PCA降维,利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度,选取相似度最高的k个节点进行加权求和,学习到目标节点在特征视图下的节点表征;
步骤3:利用元路径信息,分别在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征;
步骤4:根据目标节点的邻居信息和元路径信息,分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征;
步骤5:将上述三个视图下学习到的表征拼接,通过一次线性变换,学习到目标节点最终的节点表征;
步骤6:通过最小化交叉熵损失函数来优化模型;
步骤7:通过对生成的节点表征进行一次k-means划分成不同的社区。
2.根据权利要求1所述的基于图神经网络的社区发现方法,其特征在于:所述步骤1的具体步骤如下:
步骤1-1:将用于表征学习的异构网络定义为G=(V,E,X),其中V表示节点集合,E表示边的集合,X∈Rn*m代表图中节点的属性矩阵,n为图中节点的个数,m为每个节点特征的维度,属性矩阵X通过提取节点的语义信息生成one-hot向量得到;
步骤1-2:确定超参数,将数据集划分成训练集、验证集和测试集进行训练。
3.根据权利要求2所述的基于图神经网络的社区发现方法,其特征在于:所述步骤2的具体步骤如下:
步骤2-1:对节点的one-hot向量进行PCA降维;先对属性矩阵X的每一行进行零均值化,求出协方差矩阵并求出协方差矩阵的特征值与特征向量,将特征向量按对应特征值大小从上到下按行排列成矩阵,取前c行组成矩阵P,Y=PX即为降维到c维后的矩阵;
步骤2-2:利用余弦相似度计算降维后目标节点与其他各节点的特征的相似度:
其中,Sv,u表示两个节点之间的相似性,xv表示目标节点的属性表征,xu表示其他节点的属性表征;
步骤2-3:选取相似度最高的k个节点特征进行加权求和,学习到目标节点在特征视图下的节点表征:
其中,表示特征视图下学习到的节点v的特征,Nk表示与目标节点相似度最高的k个节点集合,w表示可学习的参数,xu表示与目标节点相似度最高的k个节点的特征。
4.根据权利要求3所述的基于图神经网络的社区发现方法,其特征在于:所述步骤3的具体步骤如下:
步骤3-1:将不同类型的节点映射到相同的嵌入层维度:
其中,hv表示映射后的隐藏层特征向量,wA表示可学习的权重矩阵,表示不同类型节点的原始特征向量;
步骤3-2:对元路径内部采用特殊的元路径实例编码器将元路径间的节点特征转换为hp(v,u),使用多头注意力机制对目标节点针对该条元路径的多个元路径实例进行加权聚合:
其中,p(v,u)表示连接目标节点v和基于元路径的邻居u的元路径实例,mp(v,u)表示p(v,u)的中间节点,是元路径p的可学习参数,表示元路径实例hp(v,u)对hv的重要性,||表示向量连接运算符;
步骤3-3:对于所有类型为A的节点在特定元路径下的学习到的节点特征进行一次线性变换后平均,使用注意力机制对不同元路径下学习到的节点特征进行加权聚合,从而学习到元路径视图下目标节点的特征:
其中,表示节点类型A的可学习参数化注意向量,MA和bA为可学习的参数,βpi为元路径pi对类型A节点的注意力系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310043047.5/1.html,转载请声明来源钻瓜专利网。