[发明专利]一种基于多任务学习的变分图自动编码器方法在审
申请号: | 202111502928.6 | 申请日: | 2021-12-09 |
公开(公告)号: | CN114118416A | 公开(公告)日: | 2022-03-01 |
发明(设计)人: | 李晶慈;陆广泉 | 申请(专利权)人: | 广西师范大学 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 桂林市华杰专利商标事务所有限责任公司 45112 | 代理人: | 刘梅芳 |
地址: | 541004 广西壮*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 学习 变分图 自动 编码器 方法 | ||
1.一种基于多任务学习的变分图自动编码器方法,其特征在于,包括如下步骤:
S1:对源数据进行预处理,具体过程为:
S11:将引文网络中的源数据处理成图数据G=(V,E),V为节点集,E为边集,假设引文网络中的一篇论文视为图中的一个节点,论文的作者、研究方向视为节点的特征,论文与被引用论文之间建立一条连接的无向边,论文所属的类别视为标签,由此一个引文网络构成一个图数据集;
S12:利用S11中获得的图数据集,得到图对应的度矩阵和邻接矩阵、特征矩阵;
S2:划分图数据集,具体过程为:
S21:将图数据集中部分数据进行掩码设置来进行半监督学习;
S22:将S12获得的矩阵中的数据划分为训练集、验证集和测试集;
S3:将S22获得的训练集输入浅层图卷积层获得浅层共享嵌入表示H,即将邻接矩阵和特征矩阵输入浅层图卷积层,通过消息传播机制H=σ(AXW),其中A是邻接矩阵,X是节点特征矩阵,W是可学习的参数矩阵,σ是激活函数,以聚合当前邻居节点的特征信息和拓扑结构信息来更新当前节点的特征信息,从而获得浅层共享嵌入表示H;
S4:将S3获得的浅层共享嵌入表示H分别输入两个不同的下游网络框架,获得各自的嵌入表示,具体过程为:
S41:将S3获得的浅层共享嵌入表示H输入用于链路预测的图卷积网络中,获得嵌入表示Z_mean和Z_log;
S42:将Z_mean和Z_log利用高斯分布进行相加,获得符合高斯分布的嵌入表示Z;
S43:将Z作为判别器的假样本输入,基于生成对抗机制,使得嵌入表示Z能够更接近原始的样本分布;
S44:将S3获得的浅层表示H输入用于节点分类的图卷积网络中,获得嵌入表示Z_nc;S5:将S4获得的两个不同的嵌入表示分别进行链路预测任务和半监督节点分类任务,具体过程为:
S51:将S4获得的嵌入表示Z输入内积层进行邻接矩阵重构,用于链路预测任务;
S52:将S4获得的嵌入表示Z输入图卷积层进行特征矩阵重构,作为链路预测的辅助任务;
S53:将S4获得嵌入表示Z_nc输入用于节点分类的图卷积网络中;
S54:计算损失函数,利用梯度下降算法来更新迭代参数,经过多次迭代之后使得损失函数可以收敛,其中,最终的损失函数公式为:
其中,C是一组节点标签,如果节点i属于c类,y是节点所属的类别标签,是节点i属于类c的softmax概率,当节点i在有标签时MASKi=1,否则MASKi=0,Eq(Z|X,A)[logp(A|Z)]-KL[q(Z|X,A)||p(Z)]为邻接矩阵的重构损失,其中KL[q(·)||p(·)]是生成样本与原始样本的相对熵,为半监督节点分类的交叉熵损失,为特征矩阵的重构损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西师范大学,未经广西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111502928.6/1.html,转载请声明来源钻瓜专利网。