[发明专利]一种数据处理方法、装置和用于数据处理的装置在审
申请号: | 201910703721.1 | 申请日: | 2019-07-31 |
公开(公告)号: | CN112307056A | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 王国赛;李艺;徐松;何旭;西方;李延凯 | 申请(专利权)人: | 华控清交信息科技(北京)有限公司 |
主分类号: | G06F16/245 | 分类号: | G06F16/245;H04L9/08 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100084 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 装置 用于 | ||
1.一种数据处理方法,其特征在于,所述方法包括:
遍历数据表中在待分组的第一维度上的数据记录,所述数据记录由至少一个字段的密文数据组成,所述密文数据为对所述字段对应的明文数据进行分散处理所得到;
将当前数据记录在目标字段对应的第二维度上与比较对象进行隐私比较,得到隐私比较结果;其中,所述比较对象包括:已遍历数据记录,或者,预置条件;
根据所述隐私比较结果将所述数据表划分为至少一个分组;其中,同一个分组中的各条数据记录的隐私比较结果相匹配。
2.根据权利要求1所述的方法,其特征在于,所述将当前数据记录在目标字段对应的第二维度上与比较对象进行隐私比较,得到隐私比较结果,包括:
对所述当前数据记录在目标字段对应的第二维度上与所述比较对象执行减法计算,得到减法计算结果;
对所述减法计算结果执行位提取计算,得到位提取计算结果;
根据所述位提取计算结果,确定所述当前数据记录与所述比较对象的隐私比较结果。
3.根据权利要求2所述的方法,其特征在于,所述比较对象为已遍历数据记录;所述根据所述隐私比较结果将所述数据表划分为至少一个分组,包括:
若所述当前数据记录与所述已遍历数据记录的隐私比较结果相匹配,则将所述当前数据记录对应的索引值加入所述已遍历数据记录对应的索引值所在的分组;否则,将所述当前数据记录对应的索引值加入新建的分组。
4.根据权利要求2所述的方法,其特征在于,所述比较对象为预置条件;所述根据所述隐私比较结果将所述数据表划分为至少一个分组,包括:
若所述当前数据记录在目标字段对应的第二维度上与所述预置条件的隐私比较结果相匹配,则将所述当前数据记录对应的索引值加入所述预置条件对应的分组。
5.根据权利要求1所述的方法,其特征在于,所述分散处理包括:对所述明文数据进行分片处理得到至少两个密文分片,以及将所述至少两个密文分片分散存储在至少两个存储节点。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
对所述分组执行隐私计算;其中,所述隐私计算至少包括如下任意一项:求和、计数、求平均值。
7.根据权利要求6所述的方法,其特征在于,所述对所述分组执行隐私计算,包括:
向隐私计算引擎发送用于指示对所述分组执行隐私计算的多方计算指令;所述隐私计算引擎包含预设数量的计算节点;
所述隐私计算引擎中的部分计算节点分别从对应的存储节点获取待计算隐私数据;所述待计算隐私数据为待执行隐私计算的分组中各条记录的目标密文数据对应的密文分片;
所述部分计算节点分别对各自获取的待计算隐私数据进行本地计算,得到所述部分计算节点各自持有的计算结果;或者,所述部分计算节点分别对各自获取的待计算隐私数据进行本地计算,以及将本地计算所产生的中间数据进行交互,得到所述部分计算节点各自持有的计算结果;
根据所述部分计算节点各自持有的计算结果,得到隐私计算结果。
8.一种数据处理装置,其特征在于,所述装置包括:
遍历模块,用于遍历数据表中在待分组的第一维度上的数据记录,所述数据记录由至少一个字段的密文数据组成,所述密文数据为对所述字段对应的明文数据进行分散处理所得到;
比较模块,用于将当前数据记录在目标字段对应的第二维度上与比较对象进行隐私比较,得到隐私比较结果;其中,所述比较对象包括:已遍历数据记录,或者,预置条件;
分组模块,用于根据所述隐私比较结果将所述数据表划分为至少一个分组;其中,同一个分组中的各条数据记录的隐私比较结果相匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华控清交信息科技(北京)有限公司,未经华控清交信息科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910703721.1/1.html,转载请声明来源钻瓜专利网。