[发明专利]保护数据隐私的双方联合训练业务预测模型的方法及装置有效
申请号: | 202010989985.0 | 申请日: | 2020-09-18 |
公开(公告)号: | CN112084520B | 公开(公告)日: | 2021-03-23 |
发明(设计)人: | 邱伟峰 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06F21/62;G06Q10/04;G06Q10/06;G06N20/00 |
代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁;周良玉 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 保护 数据 隐私 双方 联合 训练 业务 预测 模型 方法 装置 | ||
本说明书实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法及装置,其中第一方和第二方分别拥有一部分特征数据,分别维护第一和第二参数部分,通过模型迭代进行联合训练,每次迭代时,双方各自按照本次各自的正态分布随机生成各自的随机矩阵,并各自计算其特征矩阵与随机矩阵的乘积结果,基于双方得到的乘积结果与第一方拥有的标签,确定当前目标损失。若基于当前目标损失选择拒绝更新,双方各自重新执行随机生成随机矩阵以及之后的步骤。若基于当前目标损失选择接受更新,双方各自利用当前的随机矩阵更新得到本次参数部分。如此确保了隐私数据不被泄露,提高了联合训练过程中隐私数据的安全性。
技术领域
本说明书一个或多个实施例涉及数据安全和机器学习领域,具体地,涉及双方联合训练业务预测模型的方法和装置。
背景技术
机器学习所需要的数据往往会涉及到多个领域。例如在基于机器学习的商户分类分析场景中,电子支付平台拥有商户的交易流水数据,电子商务平台存储有商户的销售数据,银行机构拥有商户的借贷数据。数据往往以孤岛的形式存在。由于行业竞争、数据安全、用户隐私等问题,数据整合面临着很大阻力,将分散在各个平台的数据整合在一起训练机器学习模型难以实现。在保证数据不泄露的前提下,使用多方数据联合训练机器学习模型变成目前的一大挑战。
发明内容
为了解决上述技术问题之一,本说明书一个或多个实施例提供一种保护数据隐私的双方联合训练业务预测模型的方法、装置及电子设备。
根据第一方面,提供一种保护数据隐私的双方联合训练业务预测模型的方法,所述双方包括第一方和第二方,所述第一方存储有由多个业务对象的第一特征部分构成的第一特征矩阵,以及由所述多个业务对象的标签值构成的标签向量,并维护所述第一特征部分对应的第一参数部分;所述第二方存储有由所述多个业务对象的第二特征部分构成的第二特征矩阵,并维护所述第二特征部分对应的第二参数部分;所述方法应用于所述第一方,该方法包括,多次执行目标迭代;其中,每次目标迭代包括:
以前次迭代得到的前次第一参数部分为期望,确定本次第一正态分布;
按照所述本次第一正态分布随机生成第一随机矩阵;
计算所述第一特征矩阵与所述第一随机矩阵相乘得到的第一乘积;
从所述第二方接收第二乘积;所述第二乘积为所述第二特征矩阵与第二随机矩阵相乘的乘积;所述第二随机矩阵由所述第二方按照本次第二正态分布随机生成;所述本次第二正态分布的期望为前次迭代得到的前次第二参数部分;
基于所述第一乘积、所述第二乘积和所述标签向量,确定当前目标损失;
基于所述当前目标损失选择拒绝更新或接受更新;
若选择拒绝更新,重新执行所述随机生成第一随机矩阵以及之后的步骤;若选择接受更新,利用当前的第一随机矩阵更新得到本次第一参数部分。
可选的,所述本次第一正态分布的协方差矩阵为前次协方差矩阵与目标乘积的加权和;其中,所述前次协方差矩阵为前次迭代确定的前次第一正态分布的协方差矩阵;所述目标乘积为所述前次第一参数部分与所述前次第一参数部分的转置矩阵相乘得到的乘积。
可选的,所述基于所述当前目标损失选择拒绝更新或接受更新,包括:
确定所述当前目标损失减前次目标损失的差值;其中,所述前次目标损失为前次迭代结果对应的目标损失;
基于所述差值选择拒绝更新或接受更新。
可选的,所述基于所述差值选择拒绝更新或接受更新,包括:
若所述差值小于0,选择接受更新;
若所述差值大于0,计算目标概率作为选中接受更新的概率;所述目标概率与所述差值负相关;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010989985.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置