[发明专利]基于图神经网络的社区发现方法在审
申请号: | 202310043047.5 | 申请日: | 2023-01-29 |
公开(公告)号: | CN116304773A | 公开(公告)日: | 2023-06-23 |
发明(设计)人: | 施振佺;王博文;施佺;罗奇才;张翁坚;黄子玲;冯季;孙凡 | 申请(专利权)人: | 南通大学 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/2135;G06N3/042;G06N3/045 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 秦秋星 |
地址: | 226019 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 神经网络 社区 发现 方法 | ||
本发明公开一种基于图神经网络的社区发现方法,包括:将节点信息转换成one‑hot向量作为初始特征值;对one‑hot向量进行PCA降维,计算降维后目标节点与其他节点的特征相似度,学习到目标节点在特征视图下的节点表征;在元路径内和元路径间使用注意力机制,学习到目标节点在元路径视图下的节点表征;分层聚合邻居节点的信息,学习到目标节点在结构视图下的节点表征;拼接三种节点表征,学习到目标节点最终的节点表征;通过最小化交叉熵损失函数来优化模型;通过对生成的节点表征进行k‑means划分成不同的社区。本发明考虑了节点元路径视图下的信息以及特征视图和结构视图下的信息,提高了学习到的节点信息的丰富性与完整性,提高了表征的质量,使发现的社区更为精准。
技术领域
本发明属于社区发现技术领域,涉及一种基于图神经网络的社区发现方法。
背景技术
社区发现用来发现网络中的社区结构,也可以视为一种广义的聚类算法。我们的世界可以说是由一系列社区组成的庞大网络。例如,在社交网络中,平台能够通过社区发现更好的向检测到的社区中的目标用户推广产品。交通网络中能够更好的进行交通流的预测。引文网络中的社区检测确定研究主题的重要性、相互关联性、演变并确定研究趋势。大脑网络中的社区检测反映了大脑区域的功能和解剖分离。
一些基于图神经网络的社区发现方法主要是针对同构图来进行实现的,包括GCN、GraghSAGE、GAT等,但他们大多针对的是同构图,在异构图上的表现并不理想。当前对异构图上的研究大多基于元路径来实现,通过定义一条连接两个相同类型节点之前的元路径来实现异构图中相同类型节点之间的聚合,例如IDMB中的M-A-M(电影-演员-电影)和M-D-M(电影-导演-电影)就是两条元路径,M-A-M元路径描述了同一个演员扮演的两部电影之间的关系,M-D-M描述的是同一个导演执导的两部电影之间的关系,具有不同的语义关系。具有代表性的一些方法比如HAN,使用注意力机制通过一次元路径内的聚合以及一次元路径间的聚合将邻居节点的信息聚合到节点自身,从而实现异构图上的节点聚合,生成最终的节点嵌入以供社区发现。MAGNN作为最近较为火的一种生成异构图的嵌入的方法通过封装输入节点的属性嵌入,然后合并元路径间的语义信息,然后聚合多个元路径之间的信息,赋予一定的权重得到最终的节点嵌入。以上两种方法都是基于元路径已经给出的情况,但是现实生活中的很多元路径都是无法有效的给出,针对这种情况,GTN通过学习一种新的图形结构来自动识别作用更大的元路径,并取得了良好的效果。CP-GNN引入上下文路径概率来对学习目标函数进行建模,从而捕获高阶信息,通过另一种方式来自动生成元路径,解决了元路径需要专家进行定义的问题,另一方面,它提出根据不同元路径长度的注意力机制,并取得了一定的效果。以上一些方法都是通过有监督的方式进行的,但是现实世界中很多数据都是无标签的,针对这个问题,DGI通过最大化相似节点互信息的方式来设计目标函数,与大多数先前使用GCN进行无监督学习的方法相比,DGI不依赖于随机游走目标,并且很容易适用于转导和归纳学习设置。之后在DGI的基础上,又有人提出了HDMI,它通过将二阶互信息扩散到高阶互信息从而获取高阶节点的特征从而更好的学习节点嵌入,并且它将视图扩散到多路上,运用一次注意力机制整合不同视图下的节点嵌入。但是特征空间下的节点特征并没有被考虑,并且还没有学者将特征视图、元路径视图以及结构视图下的节点表征进行结合考虑,从而学习到更为完善的节点表征进行社区发现。
发明内容
发明目的:为克服现有技术中存在的不足,本发明在与提供一种基于图神经网络的社区发现方法,解决以前模型没有考虑特征空间下的节点特征的问题,通过余弦相似度求取与目标节点相似度较高的节点并进行加权聚合,同时考虑特征视图下、元路径视图下以及结构视图下学习到的节点特征进行一次线性变换从而学习到最终的节点表征,更好的进行社区发现。
技术法案:基于图神经网络的社区发现方法,包括如下步骤:
1.对初始数据进行预处理,将图中的节点信息转换成one-hot向量作为初始特征值,并拆分数据集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310043047.5/2.html,转载请声明来源钻瓜专利网。