[发明专利]一种差分隐私空间分解方法和系统有效
申请号: | 201811090763.4 | 申请日: | 2018-09-19 |
公开(公告)号: | CN109241774B | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 周可;李春花;李晓翠;汪洋涛 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;H04L29/06 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 430074 湖北省武汉*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 种差 隐私 空间 分解 方法 系统 | ||
本发明公开了一种差分隐私空间分解方法,包括:获取d维点数据集,根据该d维点数据集生成用于构建β树的完整域Ω、以及该完整域Ω中的点计数cnt,并从包括拉普拉斯噪声的文件中读取所有拉普拉斯噪声数据,利用得到的完整域Ω、以及该完整域Ω中的点计数cnt创建d维点数据集的β树,在创建好的β树的每个叶子节点的点计数中增加拉普拉斯噪声数据中的任意一个乘以噪声系数后得到的乘积,其中对于不同的叶子节点而言,选择使用不同的拉普拉斯噪声数据。本发明能够解决现有基于普拉斯分布的差分隐私空间分解方法存在的中间节点的隐私容易暴露、区域分解不精确导致噪声代价高、以及难以准确确定空间分解隐私树的深度的技术问题。
技术领域
本发明属于隐私保护技术领域,更具体地,涉及一种差分隐私空间分解方法和系统。
背景技术
差分隐私作为一种新出现的隐私保护框架,其通过向查询或者分析结果中添加适当噪音,从而达到隐私保护的效果。
在差分隐私保护过程中,基于安全考量,需要将整个域递归地分解成子域,以生成分层的隐私树,并向隐私树中的每个节点的点计数添加拉普拉斯噪声,这一过程被称为差分隐私空间分解。
然而,现有基于拉普拉斯分布的差分隐私空间分解方法存在一些不可忽略的技术问题:第一,由于拉普拉斯分布对于原点是对称的,在空间分解隐私树中,每一个中间节点的点个数等于其所有子节点的点个数之和,因此当所有子节点的拉普拉斯噪声之和被抵消时,会导致中间节点的隐私被暴露;第二,现有的方法在空间分解隐私树的所有节点上都增加了噪声,从根节点到叶子节点的噪声会使得区域分解不精确,同时也导致了更高的噪声代价;第三,现有方法难以准确确定空间分解隐私树的深度,空间分解隐私树的深度过大会导致添加到隐私树的噪声增加,深度过小则会导致分解的子域数量过小,进而造成查询或者分析结果会不准确。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种差分隐私空间分解方法和系统,其目的在于,解决现有基于拉普拉斯分布的差分隐私空间分解方法存在的中间节点的隐私容易暴露、区域分解不精确导致噪声代价高、以及难以准确确定空间分解隐私树的深度的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种差分隐私空间分解方法,包括以下步骤:
(1)获取d维点数据集,根据该d维点数据集生成用于构建β树的完整域Ω、以及该完整域Ω中的点计数cnt,并从包括拉普拉斯噪声的文件中读取所有拉普拉斯噪声数据;其中d是大于或等于2的自然数;
(2)利用步骤(1)中得到的完整域Ω、以及该完整域Ω中的点计数cnt创建d维点数据集的β树;
(3)在创建好的β树的每个叶子节点的点计数中增加拉普拉斯噪声数据中的任意一个乘以噪声系数后得到的乘积,其中对于不同的叶子节点而言,选择使用不同的拉普拉斯噪声数据。
优选地,步骤(1)具体包括以下子步骤:
(1-1)从预设区域中确定多个地理坐标的极值点;
(1-2)获取d维点数据集,并从d维点数据集中选择地理坐标位于步骤(1-1)所选择的多个极值点构成的区域以内的d维点,构成新的数据集D,选择的d维点的总数即为点计数cnt;
(1-3)根据构成的新的数据集D中地理坐标的极值构建完整域Ω。
优选地,步骤(1)具体包括以下子步骤:
(1-1)从预设区域中确定多个地理坐标的极值点;
(1-2)根据多个地理坐标的极值点构建完整域。
优选地,步骤(2)具体包括以下子步骤:
(2-1)创建根节点,将该根节点的域的范围设置为完整域Ω的范围,并将根节点标记为已被访问;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811090763.4/2.html,转载请声明来源钻瓜专利网。