[发明专利]一种多敏感属性数据发布中的隐私保护方法有效
申请号: | 201710511068.X | 申请日: | 2017-06-29 |
公开(公告)号: | CN107358116B | 公开(公告)日: | 2019-09-10 |
发明(设计)人: | 李春花;周可;李文 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/28 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 宋业斌 |
地址: | 430074 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种多敏感属性数据发布中的隐私保护方法,解决了多敏感属性数据发布中准标识符数据质量较差的问题。其基本思路如下:首先对数据集执行聚类,将准标识符相近的数据集聚集在一个集合,产生若干数据集合;其次,基于敏感属性构建多维桶结构,并将数据记录按照敏感属性取值映射在多维桶结构中;然后基于多维桶进行分组:选取主敏感属性,计算主敏感属性的维容量,选取L(L>=2)个维容量最大的主敏感属性,从中各选取一条数据记录,判断是否满足多敏感属性L‑多样性,如果不满足按维容量从大到小依次遍历每个桶,直到满足多敏感属性L多样性。重复上述过程,直到桶中数据不再满足多敏感属性L‑多样性。最后,对所有分组匿名化处理。 | ||
搜索关键词: | 一种 敏感 属性 数据 发布 中的 隐私 保护 方法 | ||
【主权项】:
1.一种多敏感属性数据发布中的隐私保护方法,其特征在于,包括以下步骤:(1)接收来自用户的数据集,根据数据集中非数值属性的值域构建对应于每个非数值属性的概化树,并为概化树中的每一层分配唯一的一个权值;其中将数据记录存储在数组类型的数据结构中,每个非数值类型的属性按照值域构建一棵概化树,每棵概化树存在一个数组中,构造概化树,首要任务就是将相关属性的值域进行层次化,概化树的每层都有个权值,即求两个非数值类型之间的距离,先找出这两个数值所在节点的最小公共父节点,以两个子节点到最小公共父节点的层次距离的和作为两者之间的距离;对于要发布的每条数据,需要将其抽象成向量,然后对向量每维进行距离计算,最后对计算的向量各维加权求和即是两个向量的距离,即两条数据记录的距离;(2)利用聚类算法对数据集进行处理,以得到多个数据类型相似的子数据集;(3)根据步骤(2)得到的多个子数据集构建多维桶;其具体为,首先,从多个子数据集属性中确定敏感属性和非敏感属性,然后,将敏感属性和其对应的属性值映射到多维桶结构中,从得到的多维桶结构中确定主敏感属性和次敏感属性,该主敏感属性中每个属性值对应的数据记录的数量之和为主敏感属性值的维容量;主敏感属性是人为规定的需要极力保护的属性信息,泄露对用户造成的负面影响较大的属性;(4)根据L‑多样性原则判断多维桶中是否存在可继续分组的数据记录,如果不存在则过程结束,否则进入步骤(5);其中L‑多样性原则是在K‑匿名原则的基础上发展而来,要求在K‑匿名原则的基础上,保证每个分组中的敏感属性至少有L个不同取值,进而将数据挖据者推断个体敏感信息的概率降到1/L;(5)从多维桶中选取与主敏感属性对应且维容量最大的L个属性值,从维容量最大的属性值对应的数据记录中随机选择一个加入新的分组,从维容量次大的属性值对应的数据记录中随机选择次敏感属性值不同于前一维容量的数据记录,并将其加入该新的分组,以此类推,从而得到新的分组;(6)判断得到的新的分组是否满足多敏感属性L‑多样性,如果满足,则在多维桶中删除该分组中的数据记录并进入步骤(8),否则进入步骤(7);其中多敏感属性L‑多样性指的是使用G’表示包含多敏感属性的分组,若G’中每个敏感属性都满足L‑多样性,则称G’满足多敏感属性L‑多样性;(7)从多维桶中剩余的主敏感属性值中选取维容量最大的一个,使用该主敏感属性值替换步骤(5)得到的新的分组中维容量最小的主敏感属性值对应的数据记录,然后返回步骤(6);(8)对分组进行K‑匿名化处理,以得到匿名分组,其中K‑匿名化处理是对每个分组的准标识符进行概化处理,使其满足K‑匿名原则。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710511068.X/,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置