[发明专利]基于变分解耦合方式对符号有向网络的表达学习方法有效
申请号: | 201811184604.0 | 申请日: | 2018-10-11 |
公开(公告)号: | CN109523012B | 公开(公告)日: | 2021-06-04 |
发明(设计)人: | 张娅;陈旭;姚江超;李茂森;王延峰 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q50/00 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 庄文莉 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分解 耦合 方式 符号 网络 表达 学习方法 | ||
1.一种基于变分解耦合方式对符号有向网络的表达学习方法,其特征在于,包括以下步骤:
符号有向网络数据收集步骤:读取社交网站的符号有向网络数据,所述符号有向网络数据主要包括节点间边正负和方向的网络数据;
符号有向网络分离步骤:令符号有向网络数据根据符号进行分离,得到正无向图、负无向图,所述正无向图用邻接矩阵A+表示,所述负无向图用邻接矩阵A-表示;
变分解耦合编码器步骤:令邻接矩阵A+、A-输入至变分解耦合编码器,进行节点编码后的向量表达学习,记为学习后向量表达;
结构解码器步骤:基于符号有向网络中节点间的关系构建结构解码器,令学习后向量表达依照目标损失函数进行修正,得到目标优化损失函数作为优化后向量表达;
数据挖掘任务应用步骤:令优化后向量表达应用于设定的数据挖掘任务。
2.根据权利要求1所述的基于变分解耦合方式对符号有向网络的表达学习方法,其特征在于,变分解耦合编码器步骤包括:
建立概率密度表达步骤:所述节点的向量表达解耦合成源节点表达Zs和目标节点表达Zt,令符号有向边D,建立如下的概率密度表达:
p(D)=p(D|Zs,Zt)p(Zs|θs)p(Zt|θt) (1)
式中,p(A|B)是条件概率公式,表示在事件B已经发生条件下事件A的发生概率;
D表示观测到的符号有向边集合;
p(D)表示D的概率密度表达;
p(D|Zs,Zt)表示根据Zs,Zt重构出有向边D的概率;
θs为源节点表达参数;
θt为目标节点表达参数;
Zs表示源节点表达;
Zt表示目标节点表达;
p(Zs|θs)表示根据θs得出源节点表达Zs的编码学习的概率;
p(Zt|θt)表示根据θt得出目标节点表达Zt的编码学习的概率;
建立变分图卷积表示步骤:令源节点表达Zs解耦合成正无向图中的表达和负无向图中的表达对于Zs在正无向图中的表达和Zs在负无向图中的表达用如下所示的两层变分图卷积网络表示:
式中,q(A|B)是变分分布q的条件概率公式,表示事件B发生条件下事件A发生的概率分布;
表示源节点在正无向图中的向量表达;
表示源节点在负无向图中的向量表达;
A+是正无向图的邻接矩阵,A-为负无向图的邻接矩阵;
令X∈RN×F,X为节点的特征输入值,若节点无特征输入值,则设定X=IN,其中IN为大小为N的单位矩阵,N表示矩阵R的行数,F表示矩阵R的列数,R表示特征输入矩阵;
下标i=1,2,…表示网络中节点编号;
下标s表示源节点;
上标p表示正无向图;
上标n表示负无向图;
表示第i个节点作为源节点在正无向图中的向量表达;
表示第i个节点作为源节点在负无向图中的向量表达;
和服从如下的高斯分布:
变分网络分布参数由下式定义:
和分别为对称归一化后的邻接矩阵;
式中,D+、D-分别是对角化的A+、A-的度矩阵;
N(A|B)表示均值是A,方差为B的高斯分布;
表示第i个节点作为源节点在正无向图中的变分分布参数的均值向量;
表示第i个节点作为源节点在负无向图中的变分分布参数的均值向量;
表示第i个节点作为源节点在正无向图中的变分分布参数的标准差向量;
表示第i个节点作为源节点在负无向图中的变分分布参数的标准差向量;
GCN表示图卷积网络;
分别表示变分网络分布参数、的图卷积网络;
h(·)=max(0,·)为非线性激活函数ReLU;
和是的神经网络参数,和是的神经网络参数;
表示源节点学习变分分布中的μ在正无向图中的神经网络参数,上标0表示第1层网络;
表示源节点学习变分分布中的μ在负无向图中的神经网络参数,上标0表示第1层网络;
F表示节点输入特征X的维度数;
表示源节点学习变分分布中的μ在正无向图中的神经网络参数,上标1表示第2层网络;
表示源节点学习变分分布中的μ在负无向图中的神经网络参数,上标1表示第2层网络;
和是的神经网络参数,和是的神经网络参数;
表示源节点学习变分分布中的σ在正无向图中的神经网络参数,上标0表示第1层网络;
表示源节点学习变分分布中的σ在负无向图中的神经网络参数,上标0表示第1层网络;
表示源节点学习变分分布中的σ在正无向图中的神经网络参数,上标1表示第2层网络;
表示源节点学习变分分布中的σ在负无向图中的神经网络参数,上标1表示第2层网络;
d1表示第一层GCN网络的隐空间维度;d表示第二层GCN网络的隐空间维度;
建立变分解耦合编码器的KL散度步骤:源节点表达Zs的变分解耦合编码器的KL散度Ls由下式表示:
目标节点表达Zt的变分解耦合编码器的KL散度Lt由下式表示:
KL[A||B]是描述两个分布A,B的差异大小的度量方式,公式如下:
x表示分布的随机变量;
X表示原始图数据的特征表达输入;
源节点表达Zs解耦合成正无向图中的表达和负无向图中的表达
目标节点表达Zt解耦合成正无向图中的表达和负无向图中的表达
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811184604.0/1.html,转载请声明来源钻瓜专利网。