[发明专利]基于多方安全计算训练模型的方法及装置在审

专利信息
申请号: 202211735546.2 申请日: 2022-12-31
公开(公告)号: CN116011012A 公开(公告)日: 2023-04-25
发明(设计)人: 赵得润;方文静;谭晋;王磊 申请(专利权)人: 支付宝(杭州)信息技术有限公司
主分类号: G06F21/62 分类号: G06F21/62;G06F18/214;G06F18/241;G06N3/04;G06N3/048;G06N3/08
代理公司: 北京亿腾知识产权代理事务所(普通合伙) 11309 代理人: 陈霁;周良玉
地址: 310000 浙江省杭州市*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 多方 安全 计算 训练 模型 方法 装置
【说明书】:

本说明书实施例提供一种基于多方安全计算训练模型的方法及装置,在多方联合利用各自的隐私数据进行基于逻辑回归的分类模型训练过程中,通过目标映射函数代替常规的sigmoid函数进行数据分类,以减少基于逻辑回归进行分类的分类模型在多方安全计算场景下的数据处理的复杂度,提高模型训练效率。其中,在目标映射函数满足在远离0的位置具有较高准确度的条件的情况下,可以提高分类准确度。如此,可以提高多方安全计算场景下联合训练基于逻辑回归的分类模型的可行性。

技术领域

本说明书一个或多个实施例涉及计算机技术领域,尤其涉及多方联合基于多方安全计算训练模型的方法及装置。

背景技术

计算机技术的发展,使得机器学习在各种各样的业务场景中得到越来越广泛的应用。联邦学习是一种在保护隐私数据情况下进行联合建模的方法。例如,企业与企业之间需要进行合作安全建模,可以进行联合的机器学习,以便在充分保护企业数据隐私的前提下,使用各方的数据对数据处理模型进行协作训练,从而更准确、有效地处理业务数据。联合学习可以实现在隐私保护基础上,有效打破数据孤岛,实现多方联合建模。

然而,由于行业竞争、数据安全、用户隐私等问题,数据整合面临着很大阻力,如何在保证数据不泄露的前提下将分散在各个平台的数据整合在一起,成为一项挑战。而基于多方安全计算(MPC)的联合学习过程中,复杂函数(例如非线性的sigmoid函数)由于安全计算过程中会产生不可预知的错误等,通常需要采取其他方式代替进行。

发明内容

本说明书一个或多个实施例描述了一种多方联合基于多方安全计算训练模型的方法及装置,用以解决背景技术提到的一个或多个问题。

根据第一方面,提供一种基于多方安全计算训练模型的方法,其中,所述模型为逻辑回归模型,所述方法由进行基于多方安全计算训练模型的多个数据方中的第一方执行,包括:基于对本地业务数据的处理,得到各个训练样本分别对应的第一特征分片,所述第一特征分片是用于逻辑回归映射的输入特征的分片;利用所述第一特征分片,与其他方安全联合通过目标映射函数对所述输入特征进行计算,以确定针对各个训练样本分别对应的各个预测值,从而得到各个预测值的第一预测分片,其中,目标映射函数满足以下条件:在输入特征的模大于预定值的情况下,经由目标映射函数的映射结果与经由sigmoid函数的映射结果之间的偏差小于预定阈值;根据各个预测值的第一预测分片,与其他方安全检测预测值与样本标签的差异,从而得到模型损失的第一损失分片;与其他方安全地向模型损失减小的方向调整模型参数,得到调整后的模型参数的第一分片。

在一个实施例中,第一方持有当前模型参数的第一参数分片,所述基于对本地业务数据的处理,得到各个训练样本分别对应的第一特征分片包括:获取从本地业务数据中提取的各个训练样本的第一属性特征;基于所述第一属性特征和所述第一参数分片,与其他方联合安全地通过模型参数对各个训练样本的特征数据进行融合,从而得到各个训练样本分别对应的第一特征分片。

在一个实施例中,所述目标映射函数通过关于原点对称的s型函数经由伸缩项的伸缩和偏移项的偏移得到。

在一个进一步的实施例中,在s型函数的取值在-1至1区间的情况下,偏移项为常数值0.5,伸缩项与输入特征的0.5倍正相关,与输入特征的以下之一项负相关:1与输入特征的模之和;1与输入特征的平方和的平方根。

在一个实施例中,目标映射函数的映射结果与经由sigmoid函数的映射结果之间的偏差通过以下方式确定:在模大于预定值的区间内采样多个输入特征值;针对各个输入特征值,分别利用目标映射函数和sigmoid函数进行处理得到相应的两个映射值序列;根据两个映射值序列的相似程度确定所述偏差。

在一个实施例中,第一方持有模型参数的第一参数分片,所述与其他方安全地向模型损失减小的方向调整模型参数,得到调整后的模型参数的第一分片包括:基于所述第一损失分片,与其他数据方安全确定模型损失对模型参数的梯度,得到模型参数的第一梯度分片;利用所述第一梯度分片调整模型参数的第一参数分片,调整后的第一参数分片即为模型参数的第一分片。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211735546.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top