[发明专利]一种基于个性化本地差分隐私的数据收集方法在审
申请号: | 202110650478.9 | 申请日: | 2021-06-10 |
公开(公告)号: | CN113297621A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 朱友文;贺星宇;宋仕宏;王钺程;李明洋;张帅 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 211100 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 个性化 本地 隐私 数据 收集 方法 | ||
1.一种基于个性化本地差分隐私的数据收集方法,其特征在于,包括以下步骤:
S1:服务器将原始数据集合划分为敏感数据集合XS和非敏感数据集合XN两部分,把划分结果公开;服务器设置h个隐私级别,每个级别对应不同的隐私预算,当隐私级别为t时,该级别对应的隐私预算用εt表示(t=1,2,3…,h),所有隐私级别和隐私预算一并公开;
S2:用户根据自身情况与习惯特征,任意选择一个隐私级别;用户在本地将自己的原始数据编码并扰动,随后将选择的隐私级别和扰动数据发送给服务器;
S3:服务器将用户发送的扰动数据进行聚合,数据被聚合划分至h个集合中;该h个集合与S1中设置的h个隐私级别一一对应;
S4:服务器分别对每个隐私级别对应集合中的扰动数据进行统计分析,估算出所有原始数据的频率分布结果;
S5:服务器对所有隐私级别下的频率分布结果进行加权组合,得到最终的频率分布结果。
2.根据权利要求1所述的基于个性化本地差分隐私的数据收集方法,其特征在于,在步骤S2中,所述用户在本地将自己的原始数据编码并扰动,包括:
S21:用户将自己的原始数据在本地编码成长度为|XS|+|XN|的向量,该向量每一位对应着一种原始数据,前|XS|位对应着|XS|种敏感数据,后|XN|位对应着|XN|种非敏感数据;该向量用户原始数据对应位为1,其他位均为0;
S22:对向量的每一位分别进行扰动,若向量该位为1则有概率扰动成0,若向量该位为0,则有概率扰动成1;对于向量的前|XS|位,按照如下概率进行扰动:
对于向量的后|XN|位,按照如下概率进行扰动:
其中v表示扰动前向量,vi表示扰动前向量v的第i位;u表示扰动后向量,ui表示扰动后向量u的第i位;Pr(ui|vi)表示vi扰动成ui的概率;t表示用户所选的隐私级别,εt表示用户所选的隐私级别对应的隐私预算。
3.根据权利要求1所述的基于个性化本地差分隐私的数据收集方法,其特征在于,在步骤S3中,服务器按照隐私级别对用户发送的扰动数据进行聚合,同一隐私级别的扰动数据被聚合至一个集合中,聚合完成后隐私级别数量与集合数量相等。
4.根据权利要求1所述的基于个性化本地差分隐私的数据收集方法,其特征在于,在步骤S4中,所述服务器分别对每个隐私级别对应集合中的扰动数据进行统计分析,估算出原始数据的频率分布结果,包括:
S41:服务器选择一个未得到频率分布结果的隐私级别t;
S42:服务器选择一个未在隐私级别t下得到向量数量的原始数据xi,对隐私级别t对应集合中的扰动后向量进行统计,得到xi对应位上为1的向量数量Countt(xi);
S43:迭代执行S42,直至在隐私级别t下所有的原始数据均得到对应的向量数量;
S44:服务器对所有原始数据的频率进行估计,若原始数据xi∈XS,则计算若原始数据xi∈XN,则计算其中表示隐私级别t下估计出的原始数据xi的频率,nt表示选择隐私级别t的用户数量;
S45:迭代执行S41-S44,直至所有的隐私级别都得到原始数据的频率分布结果。
5.根据权利要求1所述的基于个性化本地差分隐私的数据收集方法,其特征在于,在步骤S5中,所述服务器对所有隐私级别下的频率分布结果进行加权组合,包括:
S51:服务器对每个隐私级别生成一个权重,计算方式计算如下:
其中ωt(t=1,2,3…,h)代表隐私级别t的权重,表示所有非敏感数据的频率总和,可由S44中求出的估计频率对进行近似替代;
S52:服务器选择一个未得到最终估计频率的原始数据xi,将S4中计算出来的h个估计频率以S51中计算的权重ωt加权组合(t=1,2,3…,h),得到原始数据xi的最终估计频率,具体计算方式如下:
其中即为原始数据xi的最终估计频率;
S53:迭代执行S52,直至所有的原始数据均得到最终估计频率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110650478.9/1.html,转载请声明来源钻瓜专利网。