[发明专利]优先兼顾小桶可用性的差分隐私直方图发布方法及系统有效
申请号: | 202110345856.2 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113434897B | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 徐正全;陈友勤;毛立晖 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/2458;G06F16/906 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 严彦 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 优先 兼顾 小桶 可用性 隐私 直方图 发布 方法 系统 | ||
1.一种优先兼顾小桶可用性的差分隐私直方图发布方法,其特征在于:包括以下步骤,
步骤A,初步扰动,包括将一部分隐私预算ε1结合拉普拉斯差分隐私机制对原始直方图进行初步扰动,得到初步扰动后的中间直方图;
步骤B,阈值函数处理,包括根据隐私预算ε1设置阈值,对初步扰动后的中间直方图进行阈值处理,当中间直方图中的桶的值小于阈值时,则变更为0,反之,保持不变;
步骤C,排序,包括对步骤B更新后的中间直方图实施排序,得到从小到大排序的直方图;
步骤D,分组聚类,包括利用剩余的隐私预算ε2=ε-ε1,对已按从小到大排序的直方图进行按序分组,得到分组集合,ε是总隐私预算;实现过程包括以下子步骤,
步骤D1,初始化分组集合为空集,当前最优分组包括第一个桶,待分组起始桶标识为1;
步骤D2,若已经对所有桶分组完毕,直接进入步骤D3,当还有待分的桶时,进行以下子步骤:
步骤D2-1,根据待分组起始桶标识初始化当前分组,并记为当前分组的最优分组;
步骤D2-2,遍历当前分组和待分组起始桶之后的桶构成的各种连续区域组合,寻找一个误差最小的组合,然后进入步骤D2-3;
步骤D2-3,更新已分组的集合和待分组桶的起始标识,接着下一个分组是从待分组桶的起始标识开始,重新回到步骤D2进行分组,直到所有的桶均已分组完毕;
步骤D3,返回分组集合;
步骤E,发布,包括对分组集合中的每个分组计算一个均值,然后对每个桶采用所属分组的均值进行近似表示,接着结合剩余的隐私预算以拉普拉斯机制生成噪声样本值后与所属分组包含桶的个数之间的比值作为最终噪声的大小,得到实施扰动后的扰动直方图,并用于发布。
2.如权利要求1所述的一种优先兼顾小桶可用性的差分隐私直方图发布方法,其特征在于:步骤A的实现包括以下子步骤,
步骤A1,计算一部分隐私预算ε1=rate×ε,0<rate<1,其中,rate是隐私预算分配占比,ε是总隐私预算;
步骤A2,对原始直方图H={H1,H2,…,Hn}实现初步差分隐私扰动,得到中间直方图其中而Lap(1/ε1)是一个以1/ε1为尺度的拉普拉斯噪声,其分布为:
其中,H1,H2,…,Hn是直方图中的桶,n是桶数量,x是噪声变量,λ是尺度参数。
3.如权利要求2所述的一种优先兼顾小桶可用性的差分隐私直方图发布方法,其特征在于:步骤B中所述的阈值函数Threshold如下:
其中,θ=ηlog(n)/ε1,η>0是一个调节参数,n为直方图中桶的个数,桶标号i=1,2,…n。
4.如权利要求3所述的一种优先兼顾小桶可用性的差分隐私直方图发布方法,其特征在于:所述利用从小到大的排序算法Ascending_Sort实施排序的实现方式如下,
对于原始直方图是无序的情况下,采取常见的从小到大的排序方式进行实现;针对已是有序的原始直方图,则采取保序规则进行排序处理,以降低步骤A所进行的初步扰动而引起的排序误差,进而进一步影响之后的分组聚类和发布。
5.如权利要求4所述的一种优先兼顾小桶可用性的差分隐私直方图发布方法,其特征在于:步骤D2-2寻找一个误差最小的组合时,
当前最小平均相对误差为min=E[err(Ci)],其中分组Ci平均相对误差即分组Ci相对误差的期望;其含义是分组Ci中所包含的桶的平均值,|Ci|代表分组Ci中桶的个数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110345856.2/1.html,转载请声明来源钻瓜专利网。