[发明专利]一种纵向联邦学习的模型训练方法及系统在审
申请号: | 202210217753.2 | 申请日: | 2022-03-08 |
公开(公告)号: | CN114282692A | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 尤志强;卞阳 | 申请(专利权)人: | 富算科技(上海)有限公司 |
主分类号: | G06N20/20 | 分类号: | G06N20/20 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 唐正瑜 |
地址: | 200135 上海市浦东新区中国(*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纵向 联邦 学习 模型 训练 方法 系统 | ||
1.一种纵向联邦学习的模型训练方法,其特征在于,包括:
由数据参与方和模型发起方各自计算每一样本特征的特征值与特征权重的内积;
对每一样本特征,根据所述数据参与方和所述模型发起方的内积以及所述模型发起方的真实标签,得到梯度中间值;
由所述模型发起方,根据梯度中间值计算所述模型发起方的梯度值,生成第一随机数,对梯度中间值混淆第一随机数,并发送至所述数据参与方;
由所述数据参与方,生成第二随机数,根据混淆了第一随机数的梯度中间值计算所述数据参与方的梯度并混淆第二随机数,得到混淆了第一随机数和第二随机数的梯度并将其发送至所述模型发起方;
由所述模型发起方,对混淆了第一随机数和第二随机数的梯度去除第一随机数,得到混淆了第二随机数的梯度并发送至所述数据参与方;以及
由所述数据参与方,对混淆了第二随机数的梯度去除第二随机数,得到所述数据参与方的梯度值,并利用所述数据参与方的梯度值更新特征权重。
2.如权利要求1所述的方法,其特征在于,还包括:
由所述模型发起方基于真实标签和预测值计算模型的损失值,根据损失值判断模型是否收敛:
若收敛,则确定模型训练完成;
若不收敛,则继续迭代更新。
3.如权利要求1所述的方法,其特征在于,所述梯度中间值由对每一样本特征,将所述数据参与方和所述模型发起方的内积相加,得到总内积值,使用预设函数对总内积值进行转换得到预测值,并将预测值与对应的所述模型发起方的真实标签做差的方式获得;
其中,所述预设函数包括sigmoid函数;所述预测值由y=1/(1+e-z)计算;其中,Z为每条样本的总内积值。
4.如权利要求1所述的方法,其特征在于,所述混淆了第一随机数的梯度中间值由E_gradf _i = (y_hat_i - y_i)×R_ai计算;
其中,y_hat_i为预测值,y_i为真实标签,R_ai为第一随机数,i表示样本索引。
5.如权利要求4所述的方法,其特征在于,所述混淆了第一随机数和第二随机数的梯度由S_E_gradf _ij = E_gradf _ij×R_bi计算;
其中,E_gradf _ij = E_gradf _i×X_bij,X_bij为特征权重,j表示特征索引。
6.如权利要求5所述的方法,其特征在于,所述混淆了第二随机数的梯度由D_E_gradf_ij = S_E_gradf _ij / R_ai计算。
7.如权利要求6所述的方法,其特征在于,所述数据参与方的梯度值由gradf _ij = D_E_gradf _ij / R_bi计算。
8.如权利要求1所述的方法,其特征在于,在所述纵向联邦学习的模型训练中采用分批训练的方式。
9.如权利要求8所述的方法,其特征在于,得到所述梯度中间值之后,对所有梯度中间值进行过滤处理,得到处理后的梯度中间值;所述过滤处理包括:将梯度中间值绝对值大于或等于中间值阈值的梯度中间值保留,将梯度中间值绝对值小于中间值阈值的梯度中间值按采样比例进行采样。
10.如权利要求1所述的方法,其特征在于,利用梯度值更新特征权重,包括:
判断梯度值的绝对值是否大于梯度阈值,若是,则利用该梯度值更新特征权重;若否,则不更新特征权重。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富算科技(上海)有限公司,未经富算科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210217753.2/1.html,转载请声明来源钻瓜专利网。