[发明专利]用于联邦特征工程的数据处理方法、装置、设备以及介质在审
申请号: | 202111078529.1 | 申请日: | 2021-09-15 |
公开(公告)号: | CN113722744A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 尹靖雯;孙中伟;张钧皓;曹雨晨;姬艳鑫;张新;刘永平;宋红花;赵国梁 | 申请(专利权)人: | 京东科技信息技术有限公司 |
主分类号: | G06F21/60 | 分类号: | G06F21/60;G06Q40/02;G06N20/20 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐;马晓亚 |
地址: | 100176 北京市大兴区经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 联邦 特征 工程 数据处理 方法 装置 设备 以及 介质 | ||
本公开提供了用于联邦特征工程的数据处理方法、装置、设备以及介质,涉及深度学习领域。具体实现方案为:接收业务方发送的样本数据的第一样本标识、与第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识;根据第一样本标识以及第二样本标识,确定目标样本标识发送给数据方;根据密文标签以及目标样本标识,确定出目标密文标签发送给数据方;响应于接收到数据方基于目标样本标识以及目标密文标签进行特征分桶后计算得到的各分桶的第一标签之和以及第二标签之和,基于目标密文标签、各分桶的第一标签之和以及第二标签之和,计算以及输出目标样本标识对应的参数。本实现方式可以提高数据共享过程中的安全性。
技术领域
本公开涉及计算机技术领域,具体涉及深度学习、数据处理领域,尤其涉及用于联邦特征工程的数据处理方法、装置、设备以及介质。
背景技术
为了解决数据孤岛及数据隐私安全的问题,目前主流方法是运用联邦学习将不同的数据联合训练,得到更好的模型以解决实际问题。联邦学习根据数据的分布情况分为横向联邦学习、纵向联邦学习、以及迁移学习。其中,纵向联邦学习应用较广。例如在金融场景中,银行等金融机构中含有信贷标签,而电商平台有用户的消费数据,双方用户存在交集,银行可以利用电商的数据进行信贷风险预测,但双方不能进行数据共享,这时纵向联邦学习可以用来解决这类问题。
发明内容
本公开提供了一种用于联邦特征工程的数据处理方法、装置、设备以及介质。
根据第一方面,提供了一种用于联邦特征工程的数据处理方法,包括:接收业务方发送的样本数据的第一样本标识、与第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识,密文标签包括第一标签和第二标签;根据第一样本标识以及第二样本标识,确定目标样本标识发送给数据方;根据密文标签以及目标样本标识,确定出目标密文标签发送给数据方;响应于接收到数据方基于目标样本标识以及目标密文标签进行特征分桶后计算得到的各分桶的第一标签之和以及第二标签之和,基于目标密文标签、各分桶的第一标签之和以及第二标签之和,计算以及输出目标样本标识对应的参数。
根据第二方面,提供了一种用于联邦特征工程的数据处理装置,包括:数据接收单元,被配置成接收业务方发送的样本数据的第一样本标识、与第一样本标识对应的密文标签以及接收数据方发送的样本数据的第二样本标识,密文标签包括第一标签和第二标签;标识发送单元,被配置成根据第一样本标识以及第二样本标识,确定目标样本标识发送给数据方;标签发送单元,被配置成根据密文标签以及目标样本标识,确定出目标密文标签发送给数据方;信息输出单元,被配置成响应于接收到数据方基于目标样本标识以及目标密文标签进行特征分桶后计算得到的各分桶的第一标签之和以及第二标签之和,基于目标密文标签、各分桶的第一标签之和以及第二标签之和,计算以及输出目标样本标识对应的参数。
根据第三方面,提供了一种电子设备,包括:至少一个处理器;以及与上述至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,上述指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面所描述的方法。
根据第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,上述计算机指令用于使计算机执行如第一方面所描述的方法。
根据第五方面,一种计算机程序产品,包括计算机程序,上述计算机程序在被处理器执行时实现如第一方面所描述的方法。
根据本公开的技术可以实现数据共享,同时保证双方数据的安全性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是本公开的一个实施例可以应用于其中的示例性系统架构图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技信息技术有限公司,未经京东科技信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111078529.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种棉岩纱及其纺制方法
- 下一篇:一种消防灭火结构及消防机器人