[发明专利]联邦学习模型的训练方法、装置、电子设备和存储介质在审
申请号: | 202110939079.4 | 申请日: | 2021-08-16 |
公开(公告)号: | CN113722987A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 韩雨锦;杨恺;王虎;黄志翔;彭南博 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F21/60;G06K9/62;G06N20/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 张梦瑶 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 联邦 学习 模型 训练 方法 装置 电子设备 存储 介质 | ||
本申请提出一种联邦学习模型的训练方法、装置、电子设备和存储介质,其中,训练方法包括:与数据提供方服务器进行样本对齐;生成特征编码集,以及将数据提供方服务器的特征编号和公钥发送至数据提供方服务器;将当前样本划分为训练集和验证集,并获取联邦学习模型的参数集;根据训练集、验证集、参数集和特征编码集,对联邦学习模型进行M次迭代训练;在M次迭代训练中每次迭代训练的过程中,若判断联邦学习模型满足早停条件,则控制M次迭代训练早停,并获取M次迭代训练中最后一次迭代训练得到的联邦学习模型的目标参数。由此,能够使训练更加高效,同时提升了建模效果,并且采用了早停策略避免模型出现过拟合的同时减少了复杂度。
技术领域
本申请涉及数据处理技术领域,尤其涉及一种联邦学习模型的训练方法、装置、电子设备和存储介质。
背景技术
随着机器学习的发展,越来越多的机器学习技术被应用于各行各业。数据的数量和质量往往决定了机器学习模型效果的上限。但是随着法规和监管越来越严格,以及人们对于数据安全和隐私保护越来越重视,形成数据孤岛现象。在这样的场景下,联邦学习应运而生,它可以让参与方在不共享数据的基础上联合训练,解决数据孤岛的难题。
相关技术中,联邦学习是一种加密的分布式机器学习技术,它融合了信息加密、分布式计算和机器学习等多种技术。联邦学习根据参与方持有数据的特点可以被分为横向联邦学习、纵向联邦学习以及联邦迁移学习。在风控场景下,纵向联邦学习的应用更为广泛。
发明内容
本申请第一方面实施例提出一种联邦学习模型的训练方法,能够使业务方服务器与数据提供方服务器之间的联合训练更加高效,同时提升了建模效果,并且采用了早停策略避免模型出现过拟合的同时减少了复杂度。
本申请第二方面实施例提出一种联邦学习模型的训练方法。
本申请第三方面实施例提出一种联邦学习模型的训练装置。
本申请第四方面实施例提出一种联邦学习模型的训练装置。
本申请第五方面实施例提出一种电子设备。
本申请第六方面实施例提出一种计算机可读存储介质。
本申请第一方面实施例提出了一种联邦学习模型的训练方法,包括:
与数据提供方服务器进行样本对齐;
分别获取业务方服务器和所述数据提供方服务器的特征数量,并根据所述特征数量分别对所述业务方服务器和所述数据提供方服务器的特征进行编号,以生成特征编码集,以及将所述数据提供方服务器的特征编号和公钥发送至所述数据提供方服务器;
将当前样本划分为训练集和验证集,并获取联邦学习模型的参数集;
根据所述训练集、所述验证集、所述参数集和所述特征编码集,对所述联邦学习模型进行M次迭代训练,其中,所述M为大于1的正整数;
在所述M次迭代训练中每次所述迭代训练的过程中,若判断所述联邦学习模型满足早停条件,则控制所述M次迭代训练早停,并获取所述M次迭代训练中最后一次迭代训练得到的所述联邦学习模型的目标参数;
若判断所述联邦学习模型未满足所述早停条件,则获取第M次所述迭代训练得到的所述联邦学习模型的目标参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110939079.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:三电平变换器的调制方法、装置和电子设备
- 下一篇:节能保温杯