[发明专利]一种基于秘密分享的横向联邦IV算法在审
申请号: | 202111662666.X | 申请日: | 2021-12-30 |
公开(公告)号: | CN114548418A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 毛万葵;骆双阳;贺伟;章庆 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62;G06F21/62;H04L9/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 秘密 分享 横向 联邦 iv 算法 | ||
1.一种基于秘密分享的横向联邦IV算法,其特征在于,分布式横向联邦IV特征筛选方法,在分布式横向IV算法中使用秘密分享(SecretSharing)进一步增加数据安全性,首先发起方节点统一分组方式并实现分组,同时将分组方式同步个其他参与方,使参与方实现分组,并在分组内对标签求和;各方对标签和结果进行秘密分片,随后将分片结果发送给各方进行隐私求和;最后汇总给发起方,发起方计算woe和iv值,实现横向联邦IV算法的计算过程,从而实现特征筛选的过程,具体包括以下步骤:
1)发起方决定分箱方式并实现分箱;
2)同时发起方将分箱字典发送给各参与方,各参与方实现分箱;
3)各参与方计算本地参与计算的总数据量;
4)发起分获取各节点参与计算的总数据量,计算出所有数据总量SUM;
5)各个参与节点利用秘密分享技术对各方数据分组之后的标签和进行分片;
6)同时各节点分发子碎片,并且收集其他参与节点发送的子碎片,然后进行子碎片求和得到各方的大分片;
7)发起方节点收集各方发送的大分片,进行最后大分片求和,即可得到参与计算的所有数据的标签值1的总数SUM1,而不会泄露各方标签值,同时可计算出标签值为0的总数SUM0=SUM-SUM1;
8)计算woe和iv值,分组后,对于第i组,WOE的计算公式为(其中y表示标签值1,n表示标签值0):
WOE表示的含义即是当前分组中响应客户占所有响应客户的比例和当前分组中没有响应的客户占所有没有响应客户的比例的差异;IV衡量的是某一个变量的信息量,从公式来看的话,相当于是自变量WOE值的一个加权求和,其值的大小决定了自变量对于目标变量的影响程度,对于分组i,其对应的IV值为:
特征的IV值即为所有分组iv值之和(其中n为变量分组个数):
充分利用所有方的特征数据和标签数据,对所有特征进行上述iv值计算,在这个过程中,没有明文数据传输,A方无法获取B方的y值,同时B方也无法获取A方每个特征的值,从而在安全隐私保护的情况下,完成了特征工程iv算法的计算。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111662666.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动态生成随机数的方法
- 下一篇:一种H5网页开发平台的网页跳转方法