[发明专利]基于GNN执行预测的方法和系统以及训练方法和系统在审
申请号: | 202110483604.6 | 申请日: | 2021-04-30 |
公开(公告)号: | CN113095592A | 公开(公告)日: | 2021-07-09 |
发明(设计)人: | 赵欢;郭夏玮;全雨晗;姚权铭 | 申请(专利权)人: | 第四范式(北京)技术有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q40/02;G06N3/08;G06N20/00 |
代理公司: | 北京铭硕知识产权代理有限公司 11286 | 代理人: | 朱志玲;苏银虹 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 gnn 执行 预测 方法 系统 以及 训练 | ||
提供了一种基于GNN执行预测的方法和系统以及训练方法和系统,其中,基于GNN执行预测的方法包括:获取包含待预测样本的表数据;基于表数据创建图,其中,图中的每个节点表示表数据中的一个样本,并且图中的边表示两个样本之间的相关性;基于创建的图利用GNN学习图中与所述待预测样本对应的目标节点的特征表示;基于学习的目标节点的特征表示执行预测来获得关于目标节点的预测结果。
技术领域
本申请总体说来涉及人工智能领域,更具体地,涉及一种基于图神经网络GNN执行预测的方法和系统以及一种训练基于图神经网络GNN的机器学习模型的方法和系统。
背景技术
表数据在工业界有广泛的应用,例如商品销售、网站浏览、交易流水、金融贷款等数据都可以以表数据的形式存储。对表数据进行学习,预测在已有数据中未知的值,在现实生活中有广泛的应用,例如销量预测、商品推荐、欺诈交易检测和贷款风险预测等。现有的基于表数据的有监督学习的模型普遍考虑基于已有的特征来构建新的有效的交叉特征,从而提高模型的性能,然而,仅考虑交叉特征对模型性能和预测效果的提升仍然欠佳。鉴于此,需要能够在表数据的学习中提高模型性能和预测效果的技术。
发明内容
本申请提供一种基于图神经网络GNN执行预测的方法和系统、一种训练基于图神经网络GNN的机器学习模型的方法和系统、一种存储指令的计算机可读存储介质以及一种包括至少一个计算装置和存储指令的至少一个存储装置的系统,以至少解决相关技术中的上述问题。本申请的技术方案如下:
根据本申请的第一方面,提供了一种基于图神经网络GNN执行预测的方法,所述方法包括:获取包含待预测样本的表数据;基于表数据创建图,其中,图中的每个节点表示表数据中的一个样本,并且图中的边表示两个样本之间的相关性;基于创建的图利用GNN学习图中与所述待预测样本对应的目标节点的特征表示;基于学习的目标节点的特征表示执行预测来获得关于目标节点的预测结果。
可选地,所述图是能够反映表数据中样本之间在多个方面的相关性的多重图,其中,所述基于创建的图利用GNN学习图中与所述待预测样本对应的目标节点的特征表示,包括:通过将多重图中与目标节点有关的邻居节点和相关性分别抽取出来,获得与目标节点有关的多个子图,其中,每个子图反映样本之间在一方面的相关性;基于每个子图利用与每个子图对应的GNN分别学习目标节点的子特征表示;将目标节点的子特征表示进行聚合来获得目标节点的特征表示。
可选地,所述基于学习的目标节点的特征表示执行预测来获得关于目标节点的预测结果,包括:仅基于利用GNN学习的目标节点的特征表示执行预测来获得关于目标节点的预测结果;或者,将利用GNN学习的目标节点的特征表示与目标节点的原始特征表示或通过不同于GNN的其他方式学习的目标节点的特征表示进行拼接,并基于拼接后的特征表示执行预测来获得关于目标节点的预测结果。
可选地,所述基于表数据创建图,包括:根据表数据中的样本的特征选取能够构建样本之间的相关性的特征;基于选取的特征选择相关联的样本来创建图。
可选地,所述根据表数据的样本的特征选取能够构建样本之间的相关性的特征,包括:从样本的特征之中直接选择能够构建样本之间的相关性的特征;或者,将样本的至少两个离散特征进行组合来获得新的离散特征,作为能够构建样本之间的相关性的特征。
可选地,所述基于选取的特征选择相关联的样本来创建图,包括:在选取的特征是离散特征的情况下,将选取的特征的取值相同的样本确定为相关联的样本,并在相关联的样本之间构建边;在选取的特征是连续特征的情况下,将连续特征转化为离散特征,并将转化后的离散特征的取值相同的样本确定为相关联的样本,并在相关联的样本之间构建边。
可选地,基于每个子图利用与每个子图对应的GNN分别学习目标节点的子特征表示,包括:对由每个子图中的节点表示的样本的特征进行编码;基于编码后的特征,利用每个子图对应的GNN分别学习目标节点的子特征表示。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于第四范式(北京)技术有限公司,未经第四范式(北京)技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110483604.6/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理