[发明专利]一种计算图节点低维表征及相关应用方法在审
申请号: | 201910911795.4 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110688537A | 公开(公告)日: | 2020-01-14 |
发明(设计)人: | 李金龙;吴钰泽 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F16/901 | 分类号: | G06F16/901;G06F17/16 |
代理公司: | 11260 北京凯特来知识产权代理有限公司 | 代理人: | 郑立明;郑哲 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图结构 向量 节点序列 节点属性信息 拓扑结构信息 注意力 保留 矩阵 重要性参数 注意力机制 最大程度地 原始数据 自身信息 编码器 互信息 图节点 低维 应用 融合 挖掘 引入 分析 | ||
1.一种计算图节点低维表征及相关应用方法,其特征在于,包括:
根据图结构原始数据,计算各节点的重要性参数,从而将整个图结构用一系列的节点序列表示,得到节点序列集合;
利用得到节点序列集合计算图结构的点互信息矩阵,并利用自编码器进行初步编码,获得各节点的包含拓扑结构信息的向量表征;
根据得到节点序列集合,引入注意力机制,计算各节点的包含注意力信息与节点属性信息的向量表征;
融合各节点的包含拓扑结构信息的向量表征,以及各节点的包含注意力信息与节点属性信息的向量表征,得到各节点的保留自身信息的最终向量表征;
基于各节点的保留自身信息的最终向量表征,进行节点的分类和连边预测。
2.根据权利要求1所述的一种计算图节点低维表征及相关应用方法,其特征在于,所述根据图结构原始数据,计算各节点的重要性参数,从而将整个图结构用一系列的节点序列表示,得到节点序列集合包括:
根据图结构的邻接矩阵,计算节点的pagerank值,pagerank是一种衡量图节点重要性的值,节点wi的pagerank值计算方式如下:
其中,d是一个人工设定的参数,n表示图结构中节点的总数,N(wi)表示节点wi在图中邻居的集合,L(wi)表示节点wi的出度,如果图结构为无向图,则用点wi的度代替;
使用基于节点重要性的游走方法,即随机选取图结构中一个节点开始游走,而对于游走时下一步的选点则根据下式确定:
上式中,符号∝表示成正比例;
游走一次得到一个节点序列,将游走步骤重复指定次数,即可将整个图结构用一系列节点序列表示,最终利用游走获得的一系列节点序列表示构成节点序列集合。
3.根据权利要求1所述的一种计算图节点低维表征及相关应用方法,其特征在于,利用得到节点序列集合计算图结构的点互信息矩阵的方式包括:
点互信息是一种基于概率论的用来衡量两个变量之间相关性的方法,计算公式如下所示:
其中,概率p(wi,wj)指的是节点wi和节点wj在整个节点序列集合中,作为相邻节点出现的概率;p(wi)和p(wj)表示节点wi和节点wj在节点序列中同时出现的概率,即包含节点wi和节点wj的序列占序列总数的比例;
通过上述公式能够计算得到任意两个节点之间的点互信息,从而得到图结构中所有节点的点互信息矩阵PMIG∈RN×N,其中的N表示节点的总数;点互信息矩阵PMIG的每一项PMIij表示节点wi和节点wj的点互信息,作为图结构信息的初步表示形式,其中PMIij=PMI(i,j)。
4.根据权利要求1或2或3所述的一种计算图节点低维表征及相关应用方法,其特征在于,利用自编码器进行初步编码,获得各节点的包含拓扑结构信息的向量表征包括:
构建一个具有K层编码器和K层解码器的自编码器结构;
将点互信息矩阵的每一行与高斯噪声之和作为原始向量输入至自编码器中,自编码器之中的每一层都是全连接层,损失函数是使编码再解码得到的向量与原始向量的损失最小;
最后一层编码器所得到的向量即为各节点的包含拓扑结构信息的向量表征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910911795.4/1.html,转载请声明来源钻瓜专利网。