[发明专利]纵向联邦数据统计的去重方法、装置、终端设备及介质在审
申请号: | 202011099097.8 | 申请日: | 2020-10-14 |
公开(公告)号: | CN112416912A | 公开(公告)日: | 2021-02-26 |
发明(设计)人: | 谭明超;马国强;范涛;陈天健;杨强 | 申请(专利权)人: | 深圳前海微众银行股份有限公司 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/28;G06F17/16;G06F21/60;G06N20/00 |
代理公司: | 深圳市世纪恒程知识产权代理事务所 44287 | 代理人: | 张志江 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 纵向 联邦 数据 统计 方法 装置 终端设备 介质 | ||
1.一种纵向联邦数据统计的去重方法,其特征在于,所述纵向联邦数据统计的去重方法应用于纵向联邦中的任意一个参与方,所述纵向联邦数据统计的去重方法包括:
接收纵向联邦中的其他参与方发送的结果矩阵,其中,所述结果矩阵为所述其他参与方在本地基于自有数据中的第一待去重数据构建第一特征矩阵后,利用所述第一特征矩阵乘以预设随机矩阵得到;
在本地基于自有数据中的第二待去重数据构建第二特征矩阵,并将所述第二特征矩阵与所述结果矩阵进行纵向拼接得到拼接矩阵;
检测所述拼接矩阵中对应位置元素相同的各目标行,并针对各所述目标行指向的所述第一待去重数据和所述第二待去重数据进行去重处理。
2.如权利要求1所述的纵向联邦数据统计的去重方法,其特征在于,所述在本地基于自有数据中的第二待去重数据构建第二特征矩阵的步骤,包括:
在本地的自有数据中提取第二待去重数据,其中,所述第二待去重数据的条数大于一;
依次将每一条所述第二待去重数据中的各特征数据对应作为矩阵中一行的各个元素,以构建得到第二特征矩阵。
3.如权利要求2所述的纵向联邦数据统计的去重方法,其特征在于,所述在本地的自有数据中提取第二待去重数据的步骤,包括:
接收预设数据去重请求,并解析所述预设数据去重请求得到待去重数据统计特征,其中,所述待去重数据统计特征的数量大于或者等于一;
在本地检测自有数据中各数据标签下属于所述待去重数据统计特征的特征数据;
将相同所述数据标签下的所述特征数据作为一条第二待去重数据,以提取到各所述第二待去重数据。
4.如权利要求1所述的纵向联邦数据统计的去重方法,其特征在于,所述检测所述拼接矩阵中对应位置元素相同的各目标行的步骤,包括:
依次将所述拼接矩阵的每一行作为基准行,并遍历所述拼接矩阵中位于所述基准行以下各待检行中的各元素;
若当前所述待检行中的各所述元素均与所述基准行中对应位置处的各元素相同,则将所述待检行和所述基准行均标记为目标行。
5.如权利要求1所述的纵向联邦数据统计的去重方法,其特征在于,所述针对各所述目标行指向的所述第一待去重数据和所述第二待去重数据进行去重处理的步骤,包括:
确定各所述目标行分别在各所述第二待去重数据中指向的目标第二去重数据,并在各所述目标第二去重数据中确定唯一的保留数据;
将各所述目标第二去重数据中除所述保留数据之外的其他目标第二去重数据进行清除;
确定所述保留数据在各所述目标行中对应的保留目标行,并为各所述目标行中除所述保留目标行之外的其他目标行生成行标识;
将所述行标识发送至所述其他参与方,以供所述其他参与方确定所述行标识在各所述第一待去重数据中指向的目标第一去重数据,并清除所述目标第一去重数据。
6.一种纵向联邦数据统计的去重方法,其特征在于,所述纵向联邦数据统计的去重方法应用于纵向联邦中的协调方,所述纵向联邦数据统计的去重方法包括:
接收纵向联邦中的各参与方发送的结果矩阵,其中,所述结果矩阵为各所述参与方各自在本地基于自有数据中的待去重数据构建特征矩阵后,利用所述特征矩阵乘以预设随机矩阵得到;
将各所述结果矩阵进行纵向拼接得到拼接矩阵,并检测所述拼接矩阵中对应位置元素相同的各目标行;
根据各所述目标行控制各所述参与方针对所述待去重数据进行去重处理。
7.如权利要求6所述的纵向联邦数据统计的去重方法,其特征在于,所述根据各所述目标行控制各所述参与方针对所述待去重数据进行去重处理的步骤,包括:
在各所述目标行中确定唯一的保留目标行,并为各所述目标行中除所述保留目标行之外的其他目标行生成行标识;
将所述行标识发送至各所述参与方,以供各所述参与方各自在本地确定所述行标识在各待去重数据中指向的去重数据,并清除所述去重数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳前海微众银行股份有限公司,未经深圳前海微众银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011099097.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种套接型数控机床自动换刀系统
- 下一篇:清洁设备
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置