[发明专利]基于多视角的随机删边嵌入模型的分类方法有效
申请号: | 202110208919.X | 申请日: | 2021-02-25 |
公开(公告)号: | CN112884045B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 杨亮;栗位勋;顾军华;贾永娜;张亚娟;牛丙鑫 | 申请(专利权)人: | 河北工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 天津翰林知识产权代理事务所(普通合伙) 12210 | 代理人: | 付长杰 |
地址: | 300130 天津市红桥区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 视角 随机 嵌入 模型 分类 方法 | ||
1.一种对于论文引文网络Citeseer数据集的论文分类方法,节点是出版物,边缘是引文链接,节点属性是论文的词袋表示,所有节点分为六类,实现引文网络的精确快速分类,包括以下步骤:
步骤1、对已知的初始邻接矩阵A做图扩散操作得到图扩散矩阵S,将邻接矩阵A和图扩散矩阵S分别做随机剔除边操作得到Adrop和Sdrop;
步骤2、邻接矩阵A和图扩散矩阵S分别经过两个独立通道的多层GCN卷积层得到嵌入矩阵ZE1、ZE2,随机剔除边Adrop和随机剔除边Sdrop分别经过共享通道的多层GCN卷积层获得嵌入矩阵ZCE1、ZCE2,嵌入矩阵ZCE1与嵌入矩阵ZCE2求和获得嵌入矩阵ZCM;
步骤3、对嵌入矩阵ZE1、ZE2、ZCM使用注意力机制确定各嵌入矩阵的重要性,根据公式(10)得到最终嵌入矩阵Z;
Z=αE1·ZE1+αCM·ZCM+αE2·ZE2 (10)
其中,(αE1,αCM,αE2)分别为对应嵌入矩阵的重要性;
步骤4、将步骤3获得的最终嵌入矩阵Z输入到具有线性变换和softmax函数的半监督多类分类器中,获得对应最终嵌入矩阵Z的预测标签,将预测标签和对应的真实标签Y做交叉熵,获得交叉熵损失函数Lt,
步骤5、分别让ZE1和ZCM求KL得到KL散度的损失函数Le1,让ZE2和ZCM求KL得到KL散度的损失函数Le2,三个损失函数求和得到最终的损失函数Loss;
Loss=Lt+γLe1+βLe2
其中,γ和β是一致性和视差约束项的参数,在标记数据的指导下,通过反向传播优化建议的模型,并学习节点的嵌入以进行分类;完成嵌入模型的构建;
将Citeseer数据集的节点数据输入到该嵌入模型中,即可完成Citeseer数据集的分类。
2.根据权利要求1所述的分类方法,其特征在于,使用注意力机制确定各嵌入矩阵的重要性的具体过程是:
在节点i上,在ZE1中的嵌入是即ZE1的第i行,首先通过非线性变换对进行变换,然后使用一个共享的关注向量q∈Rh′×1根据公式(8)获得关注值
W∈Rh′×h是权重矩阵,h、h’表示权重维度,b∈Rh′×1是偏差向量;
同理,分别在嵌入矩阵ZCM和ZE2中获得节点i的关注值和
然后,使用softmax函数将关注值归一化,以得到节点i的归一化后的关注值:
越大表示对应的嵌入就越重要;
和
对于所有n个节点,三个通道的n个节点的归一化后的关注值的集合分别为:把n个节点的归一化后的关注值的集合转化为对角矩阵,获得各通道嵌入矩阵的重要性,分别表示为:
αE1=diag(αe1),αCM=diag(αcm)和αE2=diag(αe2)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北工业大学,未经河北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110208919.X/1.html,转载请声明来源钻瓜专利网。