[发明专利]基于对比学习的图神经网络的去偏方法在审
申请号: | 202211586467.X | 申请日: | 2022-12-09 |
公开(公告)号: | CN115906922A | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 郑海斌;刘涛;陈晋音 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06N3/042 | 分类号: | G06N3/042;G06N3/08;G06F18/214 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 楼明阳 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 对比 学习 神经网络 偏方 | ||
一种基于对比学习的图神经网络的去偏方法,包括:S1:客户端收集获取图数据,构建图网络;S2:将图网络进行增删连边的数据增强后,构建添加了公平约束的对比学习模型,训练至收敛后对比得到去偏效果最好的数据增强方案,获得去偏之后的图数据;S3:构建对应具体任务的图神经网络模型,在模型损失函数中添加公平约束,利用上述图数据进行训练至模型收敛,得到去除了偏差的公平模型,用于实际应用。本发明能直接起到图神经网络的节点分类任务的去偏作用,同时保证数据集能够正常的作用于节点分类系统进行分类。
技术领域
本发明涉及一种图神经网络的去偏方法,尤其涉及一种基于对比学习的图神经网络的去偏方法。
背景技术
图神经网络(Graph Neural Network,GNN)是近年来出现的一种利用深度学习直接对图结构数据进行学习的框架,其优异的性能引起了学者高度的关注和深入的探索。通过在图中的节点和边上制定一定的策略,GNN将图结构数据转化为规范而标准的表示,并输入到多种不同的神经网络中进行训练,在节点分类、边信息传播和图聚类等任务上取得优良的效果。
近年来,GNN在深度学习领域的应用愈发广泛。在实际应用中,我们会遇到许多图结构的数据,如互联网用户的社交网络,科学家之间的合作网络,银行客户之间的关系网络等,我们经常需要通过对图结构数据进行学习从而获得可靠的应用系统。具体的应用如商品的推荐系统,银行客户的贷款批准预测等诸多现实场景中都用到了GNN模型,同时也带来了一些有关GNN公平方面的问题。在原始的图数据中经常会存在一些偏见,而GNN中的消息传递机制可能会进一步放大已经存在于数据中的偏见,因而如何有效地去除GNN模型中的偏见对GNN的应用有重要的意义。现有的一些实现GNN公平的方法主要是通过添加对抗模型或在模型的目标函数中添加公平约束来实现GNN的公平性,而很少有从数据本身或在模型预训练阶段入手来去除偏见的方法。
发明内容
本发明的目的在于提供了一种基于对比学习的图神经网络的去偏方法。本发明结合了对比学习和图神经网络,能够有效降低由于图数据中对敏感属性的偏见产生的对全局模型公平性的影响。
本发明提出了一种基于对比学习的图神经网络的去偏方法,该方法首先对图数据进行随机的数据增强,然后通过对比学习对图数据进行预训练,并根据敏感属性值将节点分为两个集合,通过计算预训练得到的表示向量在两个集合上的分布的距离大小来衡量数据偏差的大小,以此判定哪些连边对结果偏差影响最大,并获得偏差更小的原数据。而在后续的模型训练阶段,通过调整目标函数,使得同一标签的节点表示尽可能接近的同时,让同一敏感属性值的节点表示尽可能远离,从而实现模型的去偏。其主要思想就是利用对比学习在预训练中就去除一部分数据中的偏差,再在后续的模型训练中应用对比学习的思想,将负样本限制在同一敏感属性值的数据上,避免模型学习影响公平的敏感属性的信息,从而达到图神经网络去偏的目的。如此得到的去偏模型可以应用在优化推荐系统,提升金融评估系统的公平性等领域。
本发明是针对存在偏见的图网络数据,提供了一种数据和模型去偏的新思路。不同于传统的对抗模型和公平约束方案,提出了一种结合对比学习的去偏方法,利用改进的对比学习算法,找到原始图数据中对偏见影响最大的连边,从数据的角度去除偏差,再结合对比学习思想与图神经网络模型,在模型训练中添加公平约束,在模型角度实现去偏的目的。
本发明的一种基于对比学习的图神经网络的去偏方法,包括以下步骤:
S1:客户端收集获取图数据,构建图网络;
S2:将图网络进行增删连边的数据增强后,构建添加了公平约束的对比学习模型,训练至收敛后对比得到去偏效果最好的数据增强方案,获得去偏之后的图数据;
S3:构建对应具体任务的图神经网络模型,在模型损失函数中添加公平约束,利用上述图数据进行训练至模型收敛,得到去除了偏差的公平模型,用于实际应用。
优选地,所述步骤S1具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211586467.X/2.html,转载请声明来源钻瓜专利网。