[发明专利]基于联邦学习的样本采样方法、设备及可读存储介质有效
申请号: | 202010123967.4 | 申请日: | 2020-02-28 |
公开(公告)号: | CN111340614B | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 马国强;范涛;郑会钿;魏文斌;谭明超;陈天健;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06N20/00;G06K9/62 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 王韬 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 联邦 学习 样本 采样 方法 设备 可读 存储 介质 | ||
1.一种基于联邦学习的样本采样方法,其特征在于,所述样本采样方法应用于进行联邦学习的第一设备,所述基于联邦学习的样本采样方法包括:
与所述第一设备相关联的第二设备进行样本对齐,获得第一样本数据;
基于预设采样比例和预设采样方式,获取所述第一样本数据对应的采样比例数;
基于所述采样比例数,对所述联邦学习的中间参数进行采样比例数处理,以通过对所述中间参数进行基于样本标签的采样处理,获得采样中间参数,并基于所述采样中间参数,构建目标算法模型,其中,所述中间参数与所述样本标签相关联。
2.如权利要求1所述基于联邦学习的样本采样方法,其特征在于,所述目标算法模型包括GBDT算法模型,所述中间参数包括一阶梯度集合和二阶梯度集合,所述第二设备包括第二样本数据,
所述基于所述采样比例数,对所述联邦学习的中间参数进行采样比例数处理,以通过对所述中间参数进行基于样本标签的采样处理,获得采样中间参数,并基于所述采样中间参数,构建目标算法模型的步骤包括:
获取目标损失函数,并对所述目标损失函数求导,获得一阶梯度集合和二阶梯度集合,其中,所述一阶梯度集合和所述二阶梯度集合均与所述样本标签相关联;
基于所述采样比例数,对所述一阶梯度集合和所述二阶梯度集合进行采样比例数处理,获得采样一阶梯度集合和采样二阶梯度集合;
基于所述采样一阶梯度集合和所述采样二阶梯度集合,构建所述GBDT算法模型。
3.如权利要求2所述基于联邦学习的样本采样方法,其特征在于,所述基于所述采样比例数,对所述一阶梯度集合和所述二阶梯度集合进行采样比例数处理,获得采样一阶梯度集合和采样二阶梯度集合的步骤包括:
计算所述采样比例数和所述一阶梯度集合的乘积,获得所述采样一阶梯度集合;
计算所述采样比例数和所述二阶梯度集合的乘积,获得所述采样二阶梯度集合。
4.如权利要求2所述基于联邦学习的样本采样方法,其特征在于,所述基于所述采样一阶梯度集合和所述采样二阶梯度集合,构建所述GBDT算法模型的步骤包括:
将所述采样一阶梯度集合和所述采样二阶梯度集合加密发送至所述第二设备;
接收所述第二设备反馈的第二分裂特征梯度直方图,其中,所述第二设备用于基于所述采样一阶梯度集合和所述采样二阶梯度集合统计所述第二样本数据对应的所述第二分裂特征梯度直方图;
基于所述采样一阶梯度集合和所述采样二阶梯度集合,统计所述第一样本数据对应的第一分裂特征梯度直方图;
基于所述第一分裂特征梯度直方图和所述第二分裂特征梯度直方图,通过预设增益公式计算最优分裂值;
基于所述最优分裂值,构建所述GBDT算法模型。
5.如权利要求4所述基于联邦学习的样本采样方法,其特征在于,所述基于所述最优分裂值,构建所述GBDT算法模型的步骤包括:
基于所述最优分裂值,分裂所述第一样本数据和所述第二样本数据共同对应的待分裂节点,获得分裂结果;
判断所述待分裂节点是否可分裂,若所述待分裂节点不可分裂,则将所述待分裂节点作为所述GBDT算法模型的叶子节点,并基于所述分裂结果,获取所述叶子节点对应的样本权重;
若所述待分裂节点可分裂,则基于所述分裂结果,生成所述待分裂节点对应的孩子节点;
获取所述孩子节点对应的最优孩子节点分裂值,并对所述孩子节点执行分裂操作,直至待构建的所述GBDT算法模型的所有节点均不可再分裂,获得所述GBDT算法模型。
6.如权利要求2所述基于联邦学习的样本采样方法,其特征在于,所述基于所述采样一阶梯度集合和所述采样二阶梯度集合,构建所述GBDT算法模型的步骤之后包括:
判断所述GBDT算法模型是否满足预设训练完成条件;
若所述GBDT算法模型满足预设训练完成条件,则将所述GBDT算法模型作为目标GBDT算法模型;
若所述GBDT算法模型不满足预设训练完成条件,则重新构建所述GBDT算法模型,直至所述GBDT算法模型满足预设训练完成条件,获得所述目标GBDT算法模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010123967.4/1.html,转载请声明来源钻瓜专利网。