[发明专利]一种基于个性化网页排位的半监督图节点分类方法在审
申请号: | 202210113155.0 | 申请日: | 2022-01-30 |
公开(公告)号: | CN114492651A | 公开(公告)日: | 2022-05-13 |
发明(设计)人: | 梁春泉;赵航;陈航;王紫 | 申请(专利权)人: | 西北农林科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 西安恒泰知识产权代理事务所 61216 | 代理人: | 王芳 |
地址: | 712100 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 个性化 网页 监督 节点 分类 方法 | ||
1.一种基于个性化网页排位的半监督图节点分类方法,其特征在于,具体包括如下步骤:
步骤1:对于给定的图,通过个性化网页排位算法计算得到图中节点的个性化网页排位值,从而得到各个标签对应的排序分布向量,根据排序分布向量得到节点的依赖向量,对依赖向量进行正则化后得到依赖关系矩阵;
步骤2、通过对图神经网络进行多层隐藏层堆叠计算得到输出的隐藏层矩阵,其中每一层隐藏层包含节点的表征学习的传播和输出两部分;
步骤3、将步骤1得到的依赖关系矩阵加入到通过步骤2得到的图神经网络的最后一层隐藏层矩阵中,得到新的全局隐藏矩阵H,则此时图神经网络的隐藏层矩阵变为H,进而图神经网络转变为新的图神经网络;
步骤4、使用新的图神经网络的softmax层进行节点分类。
2.如权利要求1所述的基于个性化网页排位的半监督图节点分类方法,其特征在于,所述步骤1具体包括如下子步骤:
步骤11,给定义一个图G=(V,E),其中,定义V是n个节点的集合,n=|V|,E是m条边的集合,E={(i,j)|i∈V,j∈V};VL是训练集节点集合,YL是训练集节点的标签集合,C表示G中包含的类别数目即不同标签的个数,C={0,1,2…C-1};
步骤12,遍历训练集节点集合VL和训练集节点的标签集合YL,依次获得训练集中标签为c的节点集合Vc;且c∈{0,1,2,…,C-1},其中,Yc表示所有节点的标签均为c的标签集合;X为G的特征矩阵k为节点集合V中每个节点的特征向量的维数;
步骤13,构造用于计算节点的个性化网页排位值PR(i,Vc)的式(1):
其中,PR(i,Vc)表示V中节点i的个性化网页排位值;λ表示衰减因子,取0.85;|Vc|表示训练集中标签为c的节点集Vc中节点的数目;In(i)表示指向节点i的邻接节点集合;节点j∈In(i)是i的邻接节点;|Out(j)|表示由节点j引出的边的数量;PR(j,Vc)表示i的邻接节点j的个性化网页排位值,式1中,初始的a+b表示节点i的度,其值等于节点i的出度a加入度b;
步骤14,将步骤12得到的集合Vc整体作为式1的输入,通过式1计算得到V中节点i的个性化网页排位值;接着将计算得到的n个节点的个性化网页排位值构成排序分布向量由式2表示:
步骤15,重复步骤14得到C个排序分布向量接着依次从C个排序分布向量中提取节点i对应的C个个性化网页排位值,提取过程用表示,其中函数表示获得节点i在类目为c时排序分布向量中的个性化网页排位值PR(i,Vc),组成节点i的依赖向量di,由式3表示:
其中,表示节点i在排序分布向量中的个性化网页排位值;
步骤16,对节点i的依赖向量di进行正则化得到R_di;
步骤17,计算依赖关系矩阵D,D={R_d0,R_d1,…,R_dn-1},
3.如权利要求1所述的基于个性化网页排位的半监督图节点分类方法,其特征在于,所述步骤16的具体操作如下:
利用式4对节点i的依赖向量di的C个个性化网页排位值进行相加得到sum(di),然后使用C个个性化网页排位值依次除以sum(di),得到正则化后的依赖向量R_di:
sum(di)=PR(i,V0)+PR(i,V1)+R(i,V2)+…+PR(i,VC-1) (4)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北农林科技大学,未经西北农林科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210113155.0/1.html,转载请声明来源钻瓜专利网。