[发明专利]一种基于图卷积网络的图相似性计算方法及装置在审
申请号: | 202011395402.8 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112529057A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 刘玉葆;李聪 | 申请(专利权)人: | 中山大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 刘翠香 |
地址: | 510275 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 图卷 网络 相似性 计算方法 装置 | ||
1.一种基于图卷积网络的图相似性计算方法,其特征在于,包括以下步骤:
分别确定第一拓扑图和第二拓扑图的初始节点特征;
分别求得第一拓扑图和第二拓扑图的节点的嵌入表示;
根据第一拓扑图和第二拓扑图的节点的嵌入表示,分别通过注意力机制和DIFFPOOL方法对节点嵌入进行汇总,分别得到第一拓扑图的扁平化全图嵌入和层次化全图嵌入,得到第二拓扑图的扁平化全图嵌入和层次化全图嵌入;
采用神经张量网络NTN分别处理第一拓扑图和第二拓扑图在扁平层面以及层次化层面的图嵌入之间的关系;
将扁平化图嵌入相似性得分与层次化图嵌入相似性得分进行拼接,将拼接输入一个含有一个隐藏层的全连接神经网络降维汇总,以得到第一拓扑图和第二拓扑图之间的相似性得分。
2.根据权利要求1所述的基于图卷积网络的图相似性计算方法,其特征在于,所述分别确定第一拓扑图和第二拓扑图的初始节点特征,具体包括:
若拓扑图为节点含标签的图,对每一种标签采用one-hot向量作为初始的特征节点;
若拓扑图为节点不含标签的图,对所有的节点采取相同的向量作为节点的初始特征向量。
3.根据权利要求1所述的基于图卷积网络的图相似性计算方法,其特征在于,所述分别求得第一拓扑图和第二拓扑图的节点的嵌入表示,具体包括;
通过图卷积网络、DeepWalk、Node2vec或LINE的方式,分别求得第一拓扑图和第二拓扑图的节点的嵌入表示。
4.根据权利要求1所述的基于图卷积网络的图相似性计算方法,其特征在于,所述分别求得第一拓扑图和第二拓扑图的节点的嵌入表示,具体包括:
将图的初始节点特征和图的邻接矩阵输入三层图卷积网络,以此得到第一拓扑图和第二拓扑图的节点的嵌入表示,每层输出的节点嵌入的维度分别为64、32、16。
5.根据权利要求1所述的基于图卷积网络的图相似性计算方法,其特征在于,还包括模型的训练方法,所述训练方法包括:
采用A*方法求出图编辑距离,并由标准化图编辑距离得来的相似性分数作为训练的目标,均方误差作为损失函数。
6.一种基于图卷积网络的图相似性计算装置,其特征在于,包括:
确定模块,用于分别确定第一拓扑图和第二拓扑图的初始节点特征;
求解模块,用于分别求得第一拓扑图和第二拓扑图的节点的嵌入表示;
注意力机制模块,用于根据第一拓扑图和第二拓扑图的节点的嵌入表示,对节点嵌入进行汇总,以得到第一拓扑图的扁平化全图嵌入和第二拓扑图的扁平化全图嵌入;
DIFFPOOL模块,用于根据第一拓扑图和第二拓扑图的节点的嵌入表示,对节点嵌入进行汇总,以得到第一拓扑图的层次化全图嵌入和第二拓扑图的层次化全图嵌入;
神经张量网络NTN模块,用于处理第一拓扑图和第二拓扑图在扁平层面以及层次化层面的图嵌入之间的关系;
拼接模块,用于将扁平化图嵌入相似性得分与层次化图嵌入相似性得分进行拼接;
降维汇总模块,用于将拼接输入一个含有一个隐藏层的全连接神经网络降维汇总,以得到第一拓扑图和第二拓扑图之间的相似性得分。
7.根据权利要求6所述的基于图卷积网络的图相似性计算装置,其特征在于,还包括:
训练模块,用于采用A*方法求出图编辑距离,并由标准化图编辑距离得来的相似性分数作为训练的目标,均方误差作为损失函数。
8.根据权利要求6所述的基于图卷积网络的图相似性计算装置,其特征在于,所述求解模块为图卷积网络、DeepWalk、Node2vec或LINE模块。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011395402.8/1.html,转载请声明来源钻瓜专利网。