[发明专利]轻量级图神经网络架构搜索方法、装置、分类方法和产品在审
申请号: | 202310478411.0 | 申请日: | 2023-04-28 |
公开(公告)号: | CN116522987A | 公开(公告)日: | 2023-08-01 |
发明(设计)人: | 朱文武;王鑫;谢贝妮 | 申请(专利权)人: | 清华大学 |
主分类号: | G06N3/042 | 分类号: | G06N3/042;G06N3/082;G06N3/0985;G06N3/063;G06F18/241 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 苟冬梅 |
地址: | 10008*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轻量级 神经网络 架构 搜索 方法 装置 分类 产品 | ||
本发明提供了一种轻量级图神经网络架构搜索方法、装置、分类方法和产品,该方法应用于深度学习技术领域,该方法包括:利用图数据,对所述超网络进行训练,优化所述超网络的参数,所述参数包括:超网络参数、算子掩码矩阵参数和架构搜索参数;利用所述超网络对所述图数据进行训练,优化所述图数据的图结构参数;重复执行上述步骤,得到优化完成后的所述参数和所述图数据的图结构参数;根据优化完成后的所述图数据的图结构参数,得到稀疏化的图数据;利用优化完成后的所述架构搜索参数和所述超网络参数,得到最佳架构;利用优化完成后的所述算子掩码矩阵参数,对所述最佳架构进行裁剪,得到用于执行节点分类任务的轻量级图神经网络架构。
技术领域
本发明涉及深度学习技术领域,特别是一种轻量级图神经网络架构搜索方法、装置、分类方法和产品。
背景技术
图神经网络可以处理图数据并且用于节点分类、图分类、链接预测等下游任务,广泛应用于社交网络分析、交通预测、欺诈检测等业务中。图神经网络架构搜索用于根据数据集,自动化地从搜索空间中搜索得到性能最优的图神经网络架构,省去人工设计架构的成本。
对于执行节点分类任务的图神经网络架构,现有的图神经网络架构搜索方法通过显式地限制图神经网络架构的计算代价,从而让搜索到的架构参数量更小以及模型训练速度更快。然而,该方法在搜索过程中效率低,且耗时长,最终得到的图神经网络架构在节点分类任务中的分类准确率不高。
因此,有必要开发一种轻量级图神经网络架构搜索方法、装置、分类方法和产品,以实现快速准确的轻量级图神经网络架构搜索。
发明内容
鉴于上述问题,本发明实施例提供了一种轻量级图神经网络架构搜索方法、装置、分类方法和产品,以便克服上述问题或者至少部分地解决上述问题。
本发明实施例第一方面提供了一种轻量级图神经网络架构搜索方法,所述方法包括:
利用图数据,对所述超网络进行训练,优化所述超网络的参数,所述参数包括:超网络参数、算子掩码矩阵参数和架构搜索参数;
利用所述超网络对所述图数据进行训练,优化所述图数据的图结构参数;
重复执行上述步骤,得到优化完成后的所述参数和所述图数据的图结构参数;
根据优化完成后的所述图数据的图结构参数,得到稀疏化的图数据;
利用优化完成后的所述架构搜索参数和所述超网络参数,得到最佳架构;
利用优化完成后的所述算子掩码矩阵参数,对所述最佳架构进行裁剪,得到用于执行节点分类任务的轻量级图神经网络架构。
可选地,所述利用图数据,对所述超网络进行训练,优化所述超网络的参数,包括:
根据所述超网络,为组成所述超网络的算子引入算子掩码矩阵,所述算子掩码矩阵用于存储所述超网络的特征转换通道能否被裁剪的信息;
利用对所述图数据进行训练所得到的优化后的图结构参数,对所述超网络参数和所述算子掩码矩阵进行训练,得到优化后的所述超网络参数和所述算子掩码矩阵参数;
利用对所述图数据进行训练所得到的优化后的图结构参数,对所述架构搜索参数进行训练,得到优化后的所述架构搜索参数,所述架构搜索参数用于控制所述超网络的算子各自的权重。
可选地,所述利用所述超网络对所述图数据进行训练,优化所述图数据的图结构参数,包括:
根据所述图数据的邻接矩阵,引入邻接矩阵掩码矩阵,所述邻接矩阵掩码矩阵用于存储所述图数据的边是否能被删除的信息;
利用对所述超网络进行训练所得到的优化后的超网络的参数,确定所述图数据中每条边的边删除难度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310478411.0/2.html,转载请声明来源钻瓜专利网。