[发明专利]数据处理方法、装置在审
申请号: | 202010646743.1 | 申请日: | 2020-07-07 |
公开(公告)号: | CN111881469A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 王绍蔚 | 申请(专利权)人: | 深圳市腾讯网域计算机网络有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 深圳市隆天联鼎知识产权代理有限公司 44232 | 代理人: | 甄伟军 |
地址: | 518000 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 | ||
1.一种数据处理方法,其特征在于,所述数据处理方法应用于终端,所述方法包括:
获取目标对象的元素集合,所述元素集合中包括至少两个元素,所述至少两个元素互不相同;
基于本地差分隐私机制,对所述元素集合进行随机扰动,得到用于掩盖目标对象的数据隐私的隐私视图数值;
将与所述目标对象的元素集合对应的隐私视图数值发送至服务器,以便于所述服务器获取统计数据。
2.根据权利要求1所述的方法,其特征在于,所述基于本地差分隐私机制,对所述元素集合进行随机扰动,得到用于掩盖目标对象的数据隐私的隐私视图数值,包括:
在预定数值范围内,分别将所述元素集合中的各个元素随机映射为一个数值,得到至少两个元素映射值;
分别确定与每个元素映射值一一对应的集合,得到至少两个元素映射集合;
基于所述至少两个元素映射集合,在所述预定数值范围内进行采样,得到用于掩盖目标对象的数据隐私的所述隐私视图数值。
3.根据权利要求2所述的方法,其特征在于,所述在预定数值范围内,分别将所述元素集合中的各个元素随机映射为一个数值,得到至少两个元素映射值,包括:
在预定数值范围内,通过伪随机函数分别将所述元素集合中的各个元素随机映射为一个数值,得到至少两个元素映射值。
4.根据权利要求3所述的方法,其特征在于,所述伪随机函数包括取模函数或位移函数或哈希函数。
5.根据权利要求2所述的方法,其特征在于,所述基于所述至少两个元素映射集合,在所述预定数值范围内进行采样,得到用于掩盖目标对象的数据隐私的所述隐私视图数值,包括:
基于所述至少两个元素映射集合,确定所述预定数值范围内的数值的概率分布;
根据所述概率分布,在所述预定数值范围内进行采样,得到用于掩盖目标对象的数据隐私的所述隐私视图数值。
6.根据权利要求5所述的方法,其特征在于,基于所述至少两个元素映射集合,确定所述预定数值范围内的数值的概率分布,包括:
确定所述至少两个元素映射集合的并集;
在所述预定数值范围内的数值属于所述并集时,确定其概率密度为第一预设值;
在所述预定数值范围内的数值不属于所述并集时,确定其概率密度为第二预设值,所述第二预设值小于所述第一预设值。
7.一种数据处理方法,其特征在于,所述数据处理方法应用于服务器,所述方法包括:
获取至少一个目标对象发送的隐私视图数值,得到至少一个隐私视图数值,所述隐私视图数值通过基于本地差分隐私机制,对目标对象的元素集合进行随机扰动而得到;
确定所述隐私视图数值在目标元素映射集合中出现的频数,所述目标元素映射集合通过目标元素映射值确定,所述目标元素映射值通过对目标元素进行随机映射得到;
基于所述频数,计算所述目标元素的元素频率的无偏估计值,所述元素频率用于表征所述目标元素在目标对象群体内出现的频率。
8.根据权利要求6所述的方法,其特征在于,所述确定所述隐私视图数值在目标元素映射集合中出现的频数,包括:
将所述隐私视图数值在目标元素映射集合中的出现的频数初始化为0;
遍历所述至少一个隐私视图数值,在所述隐私视图数值属于所述目标元素映射集合时,对所述频数加1。
9.一种数据处理装置,适用于终端,其特征在于,所述装置包括:
第一获取单元,被用于获取目标对象的元素集合,所述元素集合中包括至少两个元素,所述至少两个元素互不相同;
扰动单元,被用于基于本地差分隐私机制,对所述元素集合进行随机扰动,得到用于掩盖目标对象的数据隐私的隐私视图数值;
发送单元,被用于将与所述目标对象的元素集合对应的隐私视图数值发送至服务器,以便于所述服务器获取统计数据。
10.一种数据处理装置,适用于服务器,其特征在于,所述装置包括:
第二获取单元,被用于获取至少一个目标对象发送的隐私视图数值,得到至少一个隐私视图数值,所述隐私视图数值通过基于本地差分隐私机制,对目标对象的元素集合进行随机扰动而得到;
第一确定单元,被用于确定所述隐私视图数值在目标元素映射集合中出现的频数,所述目标元素映射集合通过目标元素映射值确定,所述目标元素映射值通过对目标元素进行随机映射得到;
第二确定单元,被用于基于所述频数,计算所述目标元素的元素频率的无偏估计值,所述元素频率用于表征所述目标元素在目标对象群体内出现的频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市腾讯网域计算机网络有限公司,未经深圳市腾讯网域计算机网络有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010646743.1/1.html,转载请声明来源钻瓜专利网。