[发明专利]机器学习模型的训练方法、装置、电子设备及存储介质在审
申请号: | 202111360276.7 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114021473A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 黄安埠 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06K9/62;G06N20/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 赵翠萍;张颖玲 |
地址: | 518052 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器 学习 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种机器学习模型的训练方法,其特征在于,应用于训练方设备,所述方法包括:
基于共享样本集以及所述训练方设备的私有样本集,训练所述训练方设备的机器学习模型;
基于所述共享样本集,调用训练后的所述机器学习模型进行预测处理,得到预测值集合;
向服务方设备发送所述预测值集合;其中,所述预测值集合用于供所述服务方设备结合其他训练方设备发送的预测值集合进行融合处理,得到融合值集合;
接收所述服务方设备发送的所述融合值集合,并根据所述融合值集合更新所述共享样本集;其中,更新后的所述共享样本集与所述私有样本集,用于供所述训练方设备对所述机器学习模型进行下一轮的训练。
2.根据权利要求1所述的方法,其特征在于,所述根据所述融合值集合更新所述共享样本集,包括:
针对所述共享样本集中每个共享样本执行以下处理:
获取所述融合值集合与所述共享样本对应的融合值,基于所述融合值替换所述共享样本的标签。
3.根据权利要求1所述的方法,其特征在于,在训练所述训练方设备的机器学习模型之前,所述方法还包括:
向所述服务方设备发送样本获取请求;
接收所述服务方设备响应于所述样本获取请求而发送的所述共享样本集;
其中,所述共享样本集包括每个所述训练方设备的私有样本集中的部分样本。
4.根据权利要求1所述的方法,其特征在于,在训练所述训练方设备的机器学习模型之前,所述方法还包括:
接收所述服务方设备发送的样本上传请求;
从所述训练方设备的私有样本集中选取部分样本,并向所述服务方设备发送所述部分样本。
5.根据权利要求4所述的方法,其特征在于,所述从所述训练方设备的私有样本集中选取部分样本,包括:
基于样本上传比例,从所述训练方设备的私有样本集中选取与所述样本上传比例对应的样本;
或者,
从所述训练方设备的所述私有样本集中选取目标数量的样本。
6.根据权利要求1所述的方法,其特征在于,在训练所述训练方设备的机器学习模型之前,所述方法还包括:
向所述服务方设备发送模型获取请求;其中,所述模型获取请求包括模型标识;
接收所述服务方设备发送的与所述模型标识对应的初始机器学习模型,将所述初始机器学习模型作为待训练的机器学习模型。
7.根据权利要求1所述的方法,其特征在于,在训练所述训练方设备的机器学习模型之前,所述方法还包括:
向所述服务方设备发送模型参数获取请求;其中,所述模型参数获取请求包括模型标识;
接收所述服务方设备发送的与所述模型标识对应的模型参数;其中,所述模型参数是所述服务方设备进行初始化得到的。
8.一种机器学习模型的训练方法,其特征在于,应用于服务方设备,所述方法包括:
向每个训练方设备发送共享样本集;其中,所述共享样本集和所述训练方设备的私有样本集,用于供所述训练方设备训练所述训练方设备的机器学习模型;
接收每个所述训练方设备发送的预测值集合并进行融合处理,得到融合值集合;其中,所述预测值集合是所述训练方设备基于所述共享样本集调用训练后机器学习学习模型进行预测处理得到的,所述机器学习模型是基于所述共享样本集和所述训练方设备的私有样本集训练的;
向所述训练方设备发送所述融合值集合;其中,所述融合值集合用于供所述训练方设备更新所述共享样本集,并结合对所述训练方设备的私有样本集对所述机器学习模型进行下一轮的训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111360276.7/1.html,转载请声明来源钻瓜专利网。