[发明专利]一种面向政务数据共享的本地化差分隐私方法有效

专利信息
申请号: 202011211693.0 申请日: 2020-11-03
公开(公告)号: CN112329056B 公开(公告)日: 2021-11-02
发明(设计)人: 朴春慧;郝玉蓉;蒋学红;郑丽娟;赵永斌;张云佐 申请(专利权)人: 石家庄铁道大学
主分类号: G06F21/62 分类号: G06F21/62;G06F16/9535;G06F16/951;G06F17/18
代理公司: 河北冀华知识产权代理有限公司 13151 代理人: 侯迎新
地址: 050043 河北省石*** 国省代码: 河北;13
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 面向 政务 数据 共享 本地化 隐私 方法
【权利要求书】:

1.一种面向政务数据共享的本地化差分隐私方法,其特征在于,该方法在CMS算法的基础上引入数据分箱思想,通过等宽分箱将数据记录分入与原始数据域相比更小的数据域范围内,并构造用于聚合的计数草图矩阵来降低时空复杂度,以克服当前隐私保护算法在数据分布稀疏处统计误差大的问题;

在数据提供方设计本地扰动器,用来扰动原始数据:首先根据敏感属性列的值的域大小对数据进行分箱,对于箱中的每一条数据,本地扰动器均选择一个随机哈希函数对其进行编码得到一个向量,并对该向量进行扰动;随后,将包含所选哈希函数索引和扰动向量的报告发送到数据需求方;

在数据需求方设计聚合器,当从数据提供方接收到所有扰动报告和相关参数后,数据需求方将通过聚合器对它们进行聚合,聚合私有化数据的数据结构是大小为k m的计数草图矩阵,数据需求方通过对矩阵中k个哈希函数对应的计数进行平均,得到各属性值的频数估计,最后统计校正后生成可用的统计数据。

2.根据权利要求1所述的一种面向政务数据共享的本地化差分隐私方法,其特征在于,具体操作过程为:

S1、原始记录首先会通过随机选择的哈希函数进行编码,因此在数据提供方设计一组哈希函数H = {h1, h2,…,hk},并规定H中的函数能够根据输入的数据输出一个不大于m的值,m为每一条数据记录中的敏感属性值d的初始化向量的长度,然后在数据提供方和数据需求方之间共享这组哈希函数;

S2、按照等宽分箱思想划分敏感属性值的域区间ZZi为划分后比原始数据域小的域区间;

S3、初始化一个集合V,用于存放后续得到的扰动报告,其中,Vi用来存放属于域区间Zi的数据记录的扰动报告;

S4、数据提供方依次对共享数据记录中的敏感属性值d进行扰动处理;

S5、数据需求方根据接收到的扰动报告和相关参数计算每个属性值的频数统计信息。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011211693.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top