[发明专利]一种基于图神经网络知识蒸馏的图节点分类方法及装置有效

专利信息
申请号: 202110102108.1 申请日: 2021-01-26
公开(公告)号: CN112861936B 公开(公告)日: 2023-06-02
发明(设计)人: 杨成;石川;刘佳玮 申请(专利权)人: 北京邮电大学
主分类号: G06F18/241 分类号: G06F18/241;G06N3/04;G06N3/08;G06Q50/20
代理公司: 北京柏杉松知识产权代理事务所(普通合伙) 11413 代理人: 丁芸;马敬
地址: 100876 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 神经网络 知识 蒸馏 节点 分类 方法 装置
【说明书】:

发明实施例提供了一种基于图神经网络知识蒸馏的图节点分类方法及装置,将所述学生模型得到的第二预测结果,拟合所述教师模型得到的第一预测结果,通过使用教师模型的第一预测结果优化学生模型的,不需要教师模型和学生模型之间的集成或迭代,也能够提高分类精度,简化了优化学生模型的过程;学生模型采用标签传播公式,通过有标签的节点传播到相邻无标签的节点,可以从图结构的先验知识中受益;也通过特征变换公式,预测无标签点集的软标签,可以从特征的先验知识中受益,即数据集中具有硬标签的点集及无标签点集的特征。从而充分的使用先验知识,提高学生模型的分类效果,从而提高分类精度。

技术领域

本发明涉及机器学习技术领域,特别是涉及一种基于图神经网络知识蒸馏的图节点分类方法及装置。

背景技术

知识蒸馏被提出用于模型压缩,其中训练一个小的轻量级学生模型来模仿预训练的大教师模型的软预测。教师模型中的知识经过蒸馏以后,会转化为学生模型中的知识。

目前,知识蒸馏与图卷积网络(Graph convolutional networks,简称GCN)结合在一起进行应用。比如,可靠数据蒸馏(Resilient Distributed Dataset,简称RDD)用相同的体系结构,训练了多个GCN学生,然后对这些GCN学生进行集成以获得更好的性能。这样两个接收大小不同的GCN相互学习。其中,教师模型和学生模型,都是GCN。

但是,目前使用GCN作为学生模型的分类效果较差。

发明内容

本发明实施例的目的在于提供一种基于图神经网络知识蒸馏的图节点分类方法及装置,用以解决现有技术中使用GCN作为学生模型的分类效果较差的技术问题。具体技术方案如下:

第一方面,本发明实施例提供了基于图神经网络知识蒸馏的图节点分类方法,包括:

获取图神经网络教师模型,数据集,以及图结构中的节点集和边集,其中,所述教师模型为图神经网络GNN分类器,并且通过所述图结构及所述数据集预训练得到的,所述教师模型用于预测无标签点集的软标签可能为所述硬标签的第一概率,得到所述无标签点集的软标签的第一预测结果;所述数据集包括:具有硬标签的点集及无标签点集,所述每个节点表示数据集中的一个点;所述点为基准引文或购买商品;

基于所述第一预测结果,所述数据集及所述图结构,采用学生模型预测无标签点集的软标签,可能为所述硬标签的第二概率,得到所述无标签点集的软标签的第二预测结果;所述学生模型是基于所有硬标签的分布,采用标签传播公式,预测有标签的节点传播到相邻无标签的节点的概率分布,以及基于每个节点的特征,采用特征变换公式,预测无标签点集的软标签进行组合训练的;

将所述学生模型得到的第二预测结果,拟合所述教师模型得到的第一预测结果,直至所述学生模型得到的第二预测结果与所述教师模型得到的第一预测结果最相近,得到训练好的学生模型;所述训练好的学生模型用于对无标签点集的软标签的预测,得到基准引文的类型或购买商品的类型。

进一步的,在所述基于所述第一预测结果,所述数据集及所述图结构,采用学生模型预测无标签点集的软标签,可能为所述硬标签的第二概率,得到所述无标签点集的软标签的第二预测结果之前,所述方法还包括:

根据如下公式:

为每个节点初始化标签预测,以完成初始化学生模型;

其中,为节点v在第k次迭代中的预测概率分布,为节点v在初始化的预测概率分布,LP为标签传播的英文简称,∈为属于,为实数集合,Y为标签集合,|.|为集合的基数,为任意,VL为有标签节点集合,V为所有节点,L为有标签,VU为无标签节点集合,U为无标签,fLP为所述第一预测结果中的LP的最终预测。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110102108.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top