[发明专利]基于随机应答技术的通用数据发布隐私保护方法有效

申请号：	201910558380.3	申请日：	2019-06-26
公开（公告）号：	CN110309671B	公开（公告）日：	2022-12-20
发明（设计）人：	周水庚;刘朝斌;陈世熹;关佶红	申请（专利权）人：	复旦大学
主分类号：	G06F21/62	分类号：	G06F21/62;G06F17/16
代理公司：	上海正旦专利代理有限公司 31200	代理人：	陆飞;陆尤
地址：	200433 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明属于隐私保护技术领域，具体为一种基于随机应答技术的通用数据发布隐私保护方法。本发明基于随机应答技术，利用矩阵分解方法与克罗内克积性质，将重构无偏估计结果的计算复杂度从指数级增长降为线性增长，实现无偏估计结果的误差最小化，并允许为每个属性单独设置隐私保护参数，有效提高计算效率、数据可用性和应用灵活性。本发明方法支持单敏感属性和多敏感属性的数据发布，所述敏感属性包括布尔型属性、分类型属性和数值型属性；本发明能够为医疗、金融、生物信息和交通等领域的科研与管理提供高效、灵活的数据发布隐私保护机制，有助于在数据发布过程中保护数据隐私的同时，保留发布数据有用信息，促进数据的共享共用。
搜索关键词：	基于随机应答技术通用数据发布隐私保护方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于随机应答技术的通用数据发布隐私保护方法，其特征在于，支持单敏感属性和多敏感属性的数据发布，所述敏感属性包括布尔型属性、分类型属性和数值型属性；为每个属性单独设置隐私参数，其无偏估计结果的重构时间与查询维度即查询涉及的敏感属性数量呈线性相关，且能够实现无偏估计结果的误差最小化；具体步骤如下：设原始数据集T拥有d个属性，A为T的属性集，第i个属性拥有n_i个不同的属性值，计数查询表示对于每一个k，查询T中同时满足第a_k个属性值的记录数量；计数查询涉及属性集A的任意非空属性子集；下面针对A中所有属性的计数查询情况即属性数量为d的情况；随机应答技术对数据的扰动是通过一定的概率分布来实现的；记原始属性值x(1≤x≤n)扰动为y(1≤y≤m)的概率是p_xy，则扰动矩阵P＝(p_ij)_n×m表示一个属性的属性值由n个扰动为m个的概率分布；对原始数据集T扰动后的数据集即为发布数据集，记为T′；基于原始数据集T的计数统计查询，能够通过在扰动后的数据集T′中进行相应查询并对查询结果进行重构，得到一个实际查询结果即T中查询得到的结果的无偏估计，从而在保护个体数据隐私的同时，保留原始数据集的统计规律；设向量x是基于原始数据集T的计数查询结果向量即需要估计的目标，其第k个元素x_k为原始数据集T中的数量；向量y是基于扰动数据集T′的计数查询结果向量，其第k个元素y_k为扰动数据集T′中的数量，E(·)代表求均值，P为扰动矩阵，则有：xP＝E(y)和E(yP^‑1)＝x因此，重构的计数结果向量x′＝yP^‑1是向量x的无偏估计，通过扰动后的计数结果向量y与扰动矩阵P的逆矩阵P^‑1相乘得到；为表述方便，记R＝P^‑1为与扰动矩阵P相对应的重构矩阵；可见，求出重构矩阵R即可得出向量x的无偏估计；对于数据集T中第i个属性，通过一个n_i×m_i的扰动矩阵P_i，独立扰动为m_i个不同的属性值；因此，组合的扰动矩阵决定了记录t∈∏{1,2,...,n_i}扰动为记录t′∈∏{1,2,...,m_i}的概率，表示克罗内克积，而根据克罗内克积性质，是一个与P相对应的组合重构矩阵；为便于将数据记录与向量、矩阵元素的下标序号对应起来，本发明定义f和f′两个函数，其中函数f将原始记录映射为扰动矩阵的列号，函数f′将扰动记录映射为扰动矩阵的行号；函数f和f′的定义模式相同，下面以f为例给出具体定义，即：f：{0,1}^d→{1...2^d}其中t∈{0，1}^d对于查询∧(t＝q)，向量x′的第f(q)个元素(即：x′_f(q))就是对计数查询真实结果的无偏估计值；只需求解元素x′_f(q)；通过求解每个数据记录的无偏估计结果，累加得到最终无偏估计结果，从而实现无偏估计结果的重构时间与查询维度呈线性相关；x′_f(q)具体计算公式如下：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于复旦大学，未经复旦大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910558380.3/，转载请声明来源钻瓜专利网。

上一篇：一种抽奖后台服务方法、系统及设备
下一篇：一种基于区块链的隐私保护的可控数据管理方法

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F21-00 防止未授权行为的保护计算机或计算机系统的安全装置
G06F21-02 .通过保护计算机的特定内部部件
G06F21-04 .通过保护特定的外围设备，如键盘或显示器
G06F21-06 .通过感知越权操作或外围侵扰
G06F21-20 .通过限制访问计算机系统或计算机网络中的节点
G06F21-22 .通过限制访问或处理程序或过程

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于随机应答技术的通用数据发布隐私保护方法有效

专利文献下载