[发明专利]一种面向政务数据共享的本地化差分隐私方法有效
申请号: | 202011211693.0 | 申请日: | 2020-11-03 |
公开(公告)号: | CN112329056B | 公开(公告)日: | 2021-11-02 |
发明(设计)人: | 朴春慧;郝玉蓉;蒋学红;郑丽娟;赵永斌;张云佐 | 申请(专利权)人: | 石家庄铁道大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/9535;G06F16/951;G06F17/18 |
代理公司: | 河北冀华知识产权代理有限公司 13151 | 代理人: | 侯迎新 |
地址: | 050043 河北省石*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 政务 数据 共享 本地化 隐私 方法 | ||
本发明涉及一种面向政务数据共享的本地化差分隐私方法,提出了基于本地化差分隐私的政务数据共享方法,该方法在CMS算法的基础上引入数据分箱思想,通过等宽分箱将数据记录分入更小的数据域范围内,形成BCS算法,从而克服了当前隐私保护算法在数据域较大且数据量较少时统计误差大的问题;之后将数据分箱思想延展应用至GRR算法中,形成BRR算法,也取得了明显的效果。为验证其有效性,将本发明改进的BCS和BRR算法分别与CMS和GRR算法在合成数据集和真实数据集上进行了对比分析,实验结果表明,本发明所提方法有效降低了统计误差,并在不同分布和数据域大小下提升了其效用性,具有较高的推广应用价值。
技术领域
本专利申请属于隐私保护技术领域,更具体地说,是涉及一种面向政务数据共享的本地化差分隐私方法。
背景技术
智慧政府需要利用数据以帮助其更准确更客观的做出决策。在各种数据中,统计数据以其概括性、及时性与服务性的特点被各领域广泛应用。智慧政府建设中,应当存在共享统计数据这样一种业务需求。为了更合理化的决策,通常一个政府部门会根据业务需求向其他部门共享某类数据记录,为本部门管理或服务决策提供辅助参考依据。政务数据共享是指政府部门为了能够打破数据壁垒,充分发挥数据价值,依照法律法规等借助信息共享平台或其他技术手段将信息或数据从一个政府部门转移到另一个部门的过程。政府数据通常涉及大量个人、企业相关数据。但若在没有适当预防措施的情况下就共享政务数据,将很容易推断出敏感信息,这一点可以从过去二十年中公开的数据泄露事件中得到证明,这些事件包括马萨诸塞州公共健康记录的去匿名化、Netflix用户的去匿名化以及参与全基因组协会研究的个人的去匿名化。
现有研究使用隐私保护技术对政务数据中可能存在的敏感信息泄露进行了研究。当前的数据隐私保护技术大致可分为三类:基于匿名的隐私保护技术、基于加密的隐私保护技术和基于差分隐私的隐私保护技术。基于匿名的隐私保护技术根据隐私数据类型与应用场景的差别,又可以进一步划分为关系型数据隐私保护、社交图谱数据隐私保护以及位置与轨迹数据隐私保护。但基于匿名的方法通常缺乏严格的隐私安全保证,因此其更适用于小规模数据的隐私保护。基于加密的方法虽然具有更好的安全性保证,但其加密操作会带来大量的计算开销,这使其难以应用于资源受限的场景中。在过去的十几年中,差分隐私(DP)蓬勃发展。它能够从理论上准确的限定隐私泄露的上限,这也是它优于传统隐私保护方案的主要特点。美国人口普查局(US Census Bureau)对人口统计数据就采用了DP模型。传统的DP模型被部署在了中央服务器上,但在实践中很难找到一个真正的可信第三方,这在一定程度上限制了传统差分隐私的应用。本地化差分隐私(LDP)在DP的基础上应运而生,其不仅可以抵御任意背景知识攻击,还能够抵御不可信第三方攻击。目前,谷歌、Apple等公司已使用LDP模型用于收集用户默认浏览器主页和搜索引擎设置的信息。
但将LDP模型应用于隐私保护政务数据共享中的研究工作还较少,这是由于这些前沿方法需要结合应用场景和变化的需求进行创新应用。在政务数据共享场景中,LDP模型存在准确性低、统计误差大等缺点,在数据域大且数据量较少的情形中尤为显著。
本地化差分隐私提供了比中心化差分隐私更强的隐私保障,其正式定义如下:
定义1:本地化差分隐私(ε-LDP)。假设x是一个私有信息,该私有信息从含k个元素的集合X中取值(令X=[k]:={0,1,2,3,…,k-1},x∈X)。私有化机制Q是从[k]到输出集Z的随机映射Q,它以概率Q(z|x)将x∈X映射到z∈Z,映射后输出的z被称为私有化样本。如果对于所有的x,x’∈X,当ε0时,有
则认为Q满足ε-本地化差分隐私。由公式(1)可知,较小的隐私预算ε可以保证较高的隐私水平。且任意一对x,x’的映射输出都是相似的,因此不能通过输出结果推断出特定的输入。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011211693.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用浆态床合成二乙基羟胺的方法
- 下一篇:一种基于人脸识别的电梯安防系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置