[发明专利]一种基于秘密分享的横向联邦IV算法在审
申请号: | 202111662666.X | 申请日: | 2021-12-30 |
公开(公告)号: | CN114548418A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 毛万葵;骆双阳;贺伟;章庆 | 申请(专利权)人: | 天翼电子商务有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06K9/62;G06F21/62;H04L9/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100037 北京市西*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 秘密 分享 横向 联邦 iv 算法 | ||
本发明公开了一种基于秘密分享的横向联邦IV算法,分布式横向联邦IV特征筛选方法,在分布式横向IV算法中使用秘密分享进一步增加数据安全性,首先发起方节点统一分组方式并实现分组,同时将分组方式同步个其他参与方,使参与方实现分组,并在分组内对标签求和;各方对标签和结果进行秘密分片,随后将分片结果发送给各方进行隐私求和;最后汇总给发起方,发起方计算woe和iv值。本发明解决了基于全同态加密技术对标签数据进行加密保护而影响计算速度的问题;同时突破大量数据的现实场景计算局限;解决各方在业务相似,但拥有的用户重合度较低情况下,本地计算不出库,也可完成计算函数执行过程,实现数据的特征筛选。
技术领域
本发明涉及隐私计算,安全多方计算,联邦机器学习等技术领域,特别涉及一种基于秘密分享的横向联邦IV算法。
背景技术
隐私计算英文全称为PrivacyCompute,是指在保护数据本身不对外泄露的前提下实现数据分析计算的技术集合。与传统数据使用方式相比,隐私计算的加密机制能够增强对于数据的保护、降低数据泄露风险。因此,包括欧盟在内的部分国家和地区将其视为“数据最小化”的一种实现方式。同时,传统数据安全手段,比如数据脱敏或匿名化处理,都要以牺牲部分数据维度为代价,导致数据信息无法有效被利用,而隐私计算则提供了另一种解决思路,保证在安全的前提下尽可能使数据价值最大化。
多方安全计算英文全称为SecureMulti-PartyComputation,一般缩写为MPC,指的是在保护数据安全隐私的前提下实现多方间数据融合计算。在网络环境中,某一任务的参与者分别拥有自己一方的数据,多个参与者通过通信协议分布式的计算某个功能函数从而完成计算任务。各个参与者为计算函数提供各自的输入,同时参与者得到函数的正确输出。同时这个过程实现对用户隐私数据的保护,也就是参与者除了可以获得自己应得的输出外,不能得到其他用户的任何输入信息。安全多方计算可以实现隐私保护下的用户数据共享,对于数据的有效利用具有重要意义。尤其信息安全相关的法律规定了严格的用户数据保护要求,传统的数据直接共享的方式已经不能满足要求。
传统的安全多方计算是通过复杂的交互式密码协议实现的。参与者将其拥有的输入数据加密后按照协议传递给其他参与者,参与者通过一系列对密文的计算与转换得到原始计算任务的输出。在此过程中,由于参与者不能直接对原始的数据做计算,其计算效率以及计算功能都会受到很大限制。通过传统安全多方计算协议实现的安全多方计算要在计算功能与计算效率直接做取舍。第一种是仅支持特定的相对简单的计算函数,不支持复杂的或者灵活的计算任务。第二种是支持通用的计算任务,但是由于效率较低仅支持少量数据的计算。
联邦学习英文全称为FederatedLearning,简称FL),又名联邦机器学习。联邦学习是实现在本地原始数据不出库的情况下,通过对中间加密数据的流通与处理来完成多方联合的机器学习训练。根据参与计算的数据在数据方之间分布的情况不同,可以分为横向联邦学习、纵向联邦学习和联邦迁移学习。
发明内容
本发明要解决的技术问题是克服现有技术的缺陷,提供一种基于秘密分享的横向联邦IV算法,利用隐私保护的分布式横向联邦IV技术,可以很好地利用多家相同行业不同机构的数据,有效突破单个机构内部和外部数据建模互通瓶颈,实现本地数据不出库、但能联合多方数据进行准确的特征筛选,使各参与方对等并共同获益的联合建模。
本发明提供了如下的技术方案:
本发明提供一种基于秘密分享的横向联邦IV算法,分布式横向联邦IV特征筛选方法,在分布式横向IV算法中使用秘密分享(SecretSharing)进一步增加数据安全性,首先发起方节点统一分组方式并实现分组,同时将分组方式同步个其他参与方,使参与方实现分组,并在分组内对标签求和;各方对标签和结果进行秘密分片,随后将分片结果发送给各方进行隐私求和;最后汇总给发起方,发起方计算woe和iv值,实现横向联邦IV算法的计算过程,从而实现特征筛选的过程,具体包括以下步骤:
1)如图1step1所示,发起方决定分箱方式并实现分箱;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼电子商务有限公司,未经天翼电子商务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111662666.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种动态生成随机数的方法
- 下一篇:一种H5网页开发平台的网页跳转方法