[发明专利]一种基于匿名化数据的纵向逻辑回归建模方法有效
申请号: | 202210573495.1 | 申请日: | 2022-05-25 |
公开(公告)号: | CN114662156B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 裴阳;毛仁歆;刘文博;马煜翔;刘洋 | 申请(专利权)人: | 蓝象智联(杭州)科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/18;G06Q40/02 |
代理公司: | 杭州天麟知识产权代理事务所(特殊普通合伙) 33374 | 代理人: | 占宇 |
地址: | 311100 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 匿名 数据 纵向 逻辑 回归 建模 方法 | ||
1.一种基于匿名化数据的纵向逻辑回归建模方法,用于金融机构联合风控建模,发起方持有K个匿名样本对应的样本数据集XA及标签值分片yA,样本数据集XA中包含n个秘密分享密文状态下的数据特征分片,参与方持有相同的K个匿名样本对应的样本数据集XB及标签值分片yB,样本数据集XB中包含n个秘密分享密文状态下的数据特征分片,其特征在于,包括以下步骤:
S1:发起方、参与方分别构建同样的纵向逻辑回归模型,初始化样本数据集XA中每个数据特征分片对应的权重系数、样本数据集XB中每个数据特征分片对应的权重系数;
S2:发起方、参与方联合计算出每个匿名样本对应的预测值Y,发起方得到预测值分片YA,参与方得到预测值分片YB,Y=YA+YB;
S3:发起方将每个匿名样本对应的标签值分片yA减去对应的预测值分片YA得到对应的残差分片ΔyA,参与方将每个匿名样本对应的标签值分片yB减去对应的预测值分片YB得到对应的残差分片ΔyB;
S4:发起方根据学习率α、匿名样本个数K、每个匿名样本对应的残差分片ΔyA计算出样本数据集XA中每个数据特征分片对应的权重系数的最新值,给这些权重系数赋予最新值;
参与方根据学习率α、匿名样本个数K、每个匿名样本对应的残差分片ΔyB计算出样本数据集XB中每个数据特征分片对应的权重系数的最新值,给这些权重系数赋予最新值;
S5:重复执行S2至S4步骤T次,完成纵向逻辑回归模型建模;
所述K个匿名样本的编号分别为1,2……K,样本数据集XA中的n个数据特征分片依次标记为XA1、XA2……XAn,n≥1,则编号为i的匿名样本对应的样本数据集为XA(i),1≤i≤K,样本数据集XA(i)的结构为XA(i)={XA1(i)、XA2(i)、……XAn(i)},样本数据集XB中的n个数据特征分片依次标记为XB1、XB2……XBn,则编号为i的匿名样本对应的样本数据集为XB(i),样本数据集XB(i)的结构为XB(i)={XB1(i)、XB2(i)、……XBn (i)};
所述步骤S2中发起方、参与方联合计算出编号为i的匿名样本对应的预测值Y(i),发起方得到预测值分片YA(i),参与方得到预测值分片YB(i)的方法包括以下步骤:
N1:发起方、参与方协商生成参数a、参数b、参数c,a*b=c,发起方持有参数分片aA、参数分片bA、参数分片cA,参与方持有参数分片aB、参数分片bB、参数分片cB,a=aA+aB,b=bA+bB,c=cA+cB;
N2:发起方计算出WAj-aA、XAj(i)-bA并将其发送给参与方,参与方计算出WBj-aB、XBj(i)-bB并将其发送给发起方;
发起方、参与方都计算出Fj =(XAj(i)-bA)+(XBj(i)-bB),Ej =(WAj-aA) + (WBj-aB),
发起方计算出中间参数分片Z(i)A:
Z(i)A= Z(i)A1+Z(i)A2……+Z(i)An,
Z(i)Aj=Fj*aA+Ej*bA+cA;
参与方计算出中间参数分片Z(i)B:
Z(i)B= Z(i)B1+Z(i)B2……+Z(i)Bn,
Z(i)Bj=Ej*Fj+Fj*aB+Ej*bB+cB;
其中,1≤j≤n,XAj(i)表示编号为i的匿名样本对应的样本数据集为XA(i)中的第j个数据特征分片,XBj(i)表示编号为i的匿名样本对应的样本数据集为XB(i)中的第j个数据特征分片,WAj表示样本数据集XA中的第j个数据特征分片XAj对应的权重系数,WBj表示样本数据集XB中的第j个数据特征分片XBj对应的权重系数;
N3:发起方、参与方根据中间参数分片Z(i)A、中间参数分片Z(i)B采用秘密分享的乘法协议计算出各自的预测值分片,发起方得到预测值分片YA(i),参与方得到预测值分片YB(i),
YA(i)+YB(i)满足如下公式:
YA(i)+YB(i)=sigmoid(Z(i)A+Z(i)B),
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于蓝象智联(杭州)科技有限公司,未经蓝象智联(杭州)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210573495.1/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置