[发明专利]用于训练机器学习模型的方法和装置在审
申请号: | 202211127226.9 | 申请日: | 2022-09-16 |
公开(公告)号: | CN115936104A | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 水源 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06N3/09 | 分类号: | G06N3/09 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 李湘;李啸 |
地址: | 200135 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 训练 机器 学习 模型 方法 装置 | ||
本申请涉及机器学习技术,特别涉及用于训练机器学习模型的方法、装置、计算机系统和用于实施该方法的计算机可读存储介质。按照本申请一个方面的用于训练机器学习模型的方法包括:生成训练样本集;基于训练样本集构建关系网络,各训练样本构成关系网络的节点,基于训练样本之间交互的存在性来定义节点之间的关系,并将训练样本的基础属性用作相应节点的属性;以及利用训练样本集来训练用于对关系网络中的节点进行分类的图神经网络以得到分类器,用于训练图神经网络的目标函数包含第一目标函数和第二目标函数,第一目标函数用于表示图神经网络输出的节点分类值与标签值之间的差异,第二目标函数用于表示节点之间在属性上的差异对目标函数的修正量。
技术领域
本申请涉及机器学习技术,特别涉及用于训练机器学习模型的方法、装置、计算机系统和用于实施该方法的计算机可读存储介质。
背景技术
近年来,以神经网络为代表的机器学习算法不断取得重大突破,其无论在性能还是效率上都显著优于传统算法。然而,数据驱动的机器学习模型会因为训练数据中存在的主观性成份而导致模型输出结果出现偏差或误判。
发明内容
本申请的一个目的是提供一种用于训练机器学习模型的装置和方法,其能够消除或减少主观性成份对机器学习模型输出结果的影响。
按照本申请的一个方面,提供一种用于训练机器学习模型的方法,包括:
生成训练样本集;
基于所述训练样本集构建关系网络,其中,所述训练样本集中的各个训练样本构成所述关系网络的节点,基于所述训练样本之间交互的存在性来定义所述节点之间的关系,并且将所述训练样本的基础属性用作相应节点的属性;以及
利用所述训练样本集来训练用于对所述关系网络中的节点进行分类的图神经网络以得到分类器,
其中,用于训练所述图神经网络的目标函数包含第一目标函数和第二目标函数,所述第一目标函数用于表示所述图神经网络输出的节点分类值与标签值之间的差异,所述第二目标函数用于表示节点之间在属性上的差异对所述目标函数的修正量。
可选地,在上述方法中,所述训练样本集的生成包括:
输入数据集D=(X,y),其中X为数据集中样本的基础属性,y为所述样本的标签值;以及
将所述数据集D拆分为训练样本集Dtr=(Xtr,ytr)、验证样本集Dval=(Xval,yval)和测试样本集Dte=(Xte,yte),其中,Xtr,ytr分别为所述训练样本集中的训练样本的基础属性和标签值,Xval、yval分别为所述验证样本集中的验证样本的基础属性和标签值,Xte、yte分别为所述测试样本集中的测试样本的基础属性和标签值。
可选地,在上述方法中,所述基础属性经过特征工程处理。
可选地,在上述方法中,所述关系网络G=(V,E,X)包括由所述训练样本组成的节点集V={vi}、边集E和属性集X,边集表示所述训练样本间的交互关系E={eij=(vi,vj)|vi,vj∈V},如果训练样本vi和vj在设定时段内发生交互,则eij=1,否则eij=0,每个训练样本vi∈V具有属性xi∈X。
可选地,在上述方法中,所述目标函数为所述第一目标函数和所述第二目标函数的线性组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211127226.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大豆皂苷相关的KASP标记及其应用
- 下一篇:控制方法及摄像装置