[发明专利]一种数据查询隐私保护的隐私预算分配和数据发布方法及其系统有效
申请号: | 201810181229.8 | 申请日: | 2018-03-06 |
公开(公告)号: | CN108537055B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 杨庚;唐海霞;白云璐;王璇 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/248 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林;姚兰兰 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 查询 隐私 保护 预算 分配 发布 方法 及其 系统 | ||
1.一种数据查询隐私保护的隐私预算分配和数据发布方法,其特征在于,包括以下步骤:
步骤一:设置隐私预算参数:
对存储于计算机系统中的数据库,数据管理员根据数据的重要程度,给定数据的隐私预算,记为ε,其中0ε≤1;并设定对数据的基础查询次数,记为k,其中k200;
步骤二:计算每次查询隐私预算:
根据所述隐私预算ε和基础查询次数k,利用泊松概率机制,实现对所述隐私预算ε的无穷次分配;对用户每提交一次数据查询,结果记为fi,计算其分配的隐私预算,记为εi,具体值为:
步骤三:计算添加在数据中的噪声:
对用户的每一次数据查询结果fi,计算敏感度Δfi;再结合分配给查询的隐私预算εi,对查询结果应用差分隐私保护算法,计算需要添加的噪声,得到含有噪声的查询结果;
步骤四:返回用户查询的结果:
根据用户提交的查询,返回含有噪声的查询结果,使数据的隐私得到保护;
步骤二中,所述泊松概率机制具体如下:
泊松分布满足期望值E(X)=λ,表示单位时间内随机时间的平均发生率;
要实现交互式场景下用户的无穷次查询,用户每提交一次查询,系统便为查询分配一个隐私预算εi并应用差分隐私保护算法Mi,Mi满足εi-差分隐私,1≤i≤∞,隐私预算和应满足
设泊松分布期望值等于用户基础查询次数,即E(X)=k,则有两边同时乘以ε,即满足上述的隐私预算无穷分配;
泊松机制下的隐私预算分配计算方法如下:
2.根据权利要求1所述的数据查询隐私保护的隐私预算分配和数据发布方法,其特征在于,步骤一中,所述隐私预算ε代表隐私保护水平,ε越小,隐私保护水平越高,反之,隐私保护水平就越低,同时ε也影响着噪声的大小,越小的ε就会引入越大的噪声;
所述基础查询次数k表示用户理想的查询次数,经过k次查询返回精确的查询结果;为了保证数据的隐私性,当查询次数超过k时,系统返回噪音查询结果。
3.根据权利要求1所述的数据查询隐私保护的隐私预算分配和数据发布方法,其特征在于,步骤二中,应用差分隐私的序列组合性质:
差分隐私保护算法M1,M2,…,M∞,分别满足εi-差分隐私,其中,1≤i≤∞,对于同一个数据集D,算法{M1,M2,…,M∞}的序列组合提供
4.根据权利要求1所述的数据查询隐私保护的隐私预算分配和数据发布方法,其特征在于,步骤三中,所述敏感度Δfi的计算方式为:
对于任意一个函数f:D→Rd,函数f的敏感度为
其中,数据集D和D′为邻近数据集,具有相同的属性结构,两者之间至多相差一条记录。
5.根据权利要求4所述的数据查询隐私保护的隐私预算分配和数据发布方法,其特征在于,步骤三中,通过拉普拉斯分布产生噪音,从而实现差分隐私保护,输出结果为:其中即为拉普拉斯噪音变量,噪音量的大小与查询敏感度Δfi成正比,与分配的隐私预算εi成反比。
6.一种数据查询隐私保护的隐私预算分配和数据发布系统,其特征在于,包括:
差分隐私预算总量设定模块,用于根据隐私保护需求程度,设定差分隐私预算总量;
对存储于计算机系统中的数据库,数据管理员根据数据的重要程度,给定数据的隐私预算,记为ε,其中0ε≤1;并设定对数据的基础查询次数,记为k,其中k200;
差分隐私预算序列生成模块,用于计算在每次数据查询中的差分隐私预算,生成差分隐私预算序列;
根据所述隐私预算ε和基础查询次数k,利用泊松概率机制,实现对所述隐私预算ε的无穷次分配;对用户每提交一次数据查询,结果记为fi,计算其分配的隐私预算,记为εi,具体值为:
所述泊松概率机制具体如下:
泊松分布满足期望值E(X)=λ,表示单位时间内随机时间的平均发生率;
要实现交互式场景下用户的无穷次查询,用户每提交一次查询,系统便为查询分配一个隐私预算εi并应用差分隐私保护算法Mi,Mi满足εi-差分隐私,1≤i≤∞,隐私预算和应满足
设泊松分布期望值等于用户基础查询次数,即E(X)=k,则有两边同时乘以ε,即满足上述的隐私预算无穷分配;
泊松机制下的隐私预算分配计算方法如下:
随机噪声计算模块,用于根据用户提交的查询、查询的敏感度,采用差分隐私预算序列计算随机噪声;
对用户的每一次数据查询结果f_i,计算敏感度Δf_i;再结合分配给查询的隐私预算ε_i,对查询结果应用差分隐私保护算法,计算需要添加的噪声,得到含有噪声的查询结果;
查询结果返回模块,用于计算含有噪声的查询结果,并向用户返回查询结果;
根据用户提交的查询,返回含有噪声的查询结果,使数据的隐私得到保护。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810181229.8/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置