[发明专利]一种敏感数据发布中的隐私保护方法有效
申请号: | 201710043245.6 | 申请日: | 2017-01-19 |
公开(公告)号: | CN106874788B | 公开(公告)日: | 2019-10-08 |
发明(设计)人: | 李春花;周可;胡家琦 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 武汉臻诚专利代理事务所(普通合伙) 42233 | 代理人: | 向彬 |
地址: | 430074 湖北省*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种敏感数据发布中的隐私保护方法,包括:接收来自用户的数据集以及对应的多个概化输入树,遍历数据集中的每一组数据,并依次判断该组数据中的每一列数据是否存在对应的概化输入树,如果存在,则根据该数据的属性值在对应概化输入树中查找对应的节点,并将该节点的信息输入到坐标数组中,如果不存在,则直接将该数据的属性值输入坐标数组中,从而得到m行坐标数组,并为每个坐标数组添加初始值为0的标志位,建立p个簇,从m行坐标数组中随机选择其中p行坐标数组分别作为建立的p个簇的中心点。本发明使用先聚类再概化的方法,不仅提高了计算效率,也为进行大规模计算奠定了基础。 | ||
搜索关键词: | 一种 敏感数据 发布 中的 隐私 保护 方法 | ||
【主权项】:
1.一种敏感数据发布中的隐私保护方法,其特征在于,包括以下步骤:(1)接收来自用户的数据集以及对应的多个概化输入树,该数据集具有m组,每组数据具有n个属性;其中概化输入树采用的是一种树形的结构,即父节点和子节点结合的方式,用于表示数据概化之间的关系,数据集中的不同列具有不同的属性,该列所对应的概化输入树就描述了该列属性对应的多个属性值之间的概化规则,该概化输入树的数量是小于或等于数据集中每组数据的属性数量;(2)遍历数据集中的每一组数据,并依次判断该组数据中的每一列数据是否存在对应的概化输入树,如果存在,则根据该数据的属性值在对应概化输入树中查找对应的节点,并将该节点的信息输入到坐标数组中,如果不存在,则直接将该数据的属性值输入坐标数组中,从而得到m行坐标数组,并为每个坐标数组添加初始值为0的标志位;(3)建立标志位分别为1,2,…,p的p个簇,从m行坐标数组中随机选择其中p行坐标数组分别作为建立的p个簇的中心点,其中0<p≤m;(4)依次对m行坐标数组中的每一行,分别获取其与p个中心点之间的距离,选取得到的p个结果中最小值对应的中心点对应的簇,将该行坐标数组添加到对应的簇中,并将当前行坐标数组的标志位设置为当前簇的标志位;(5)重新获取步骤(4)中得到的每个簇的中心点作为新的中心点;(6)判断步骤(5)获得的新的中心点是否与对应的原中心点是否相同,如果相同则进入步骤(7),否则返回步骤(4);(7)针对得到的每一个簇,判断该簇中坐标数组的个数是否大于2k,其中k是用户预先设置的匿名组的数量,是则计算出该簇的中心点,获取该簇中距离该中心点最远的坐标数组s,获取距离坐标数组s最远的坐标数组u,将距离坐标数组s最近的k‑1个坐标数组与s归为一个k匿名组中,将距离坐标数组u最近的k‑1个坐标数组与u归为一个k匿名组中,并将这些归入k匿名组中的坐标数组从簇中删除;否则判断该簇中坐标数组的个数是否大于k,如果是则将该簇中坐标数组归为一个k匿名组,并将这些归入k匿名组中的坐标数组从簇中删除,否则将该簇中坐标数组归入上一次归入的k匿名组中,并将这些归入k匿名组中的坐标数组从簇中删除;(8)重复步骤(7),直到簇中的坐标数组数量为0为止;(9)根据概化输入树对得到的多个k匿名组进行概化输出,其具体为,对于k匿名组中数字类型,是通过输出该匿名组中数字的取值范围进行概化;对于k匿名组中字符串型数据,如果该k匿名组中所有的字符串均相同,则输出该字符串,否则输出通配符;对于k匿名组中节点信息,首先比较两个节点是否相同,相同则输出当前节点,不同则比较其所在的层数是否相同,如果层数相同则比较其父节点是否相同,父节点相同则输出该父节点,父节点不同则继续判断其各自上一级父节点是否相同,如果相同,则输出该上一级父节点,否则继续判断其上一级父节点并重复本过程;如果层数不相同,则将层数大的节点的上一级父节点与另一个节点进行比较,看二者层数是否相同,如果层数相同,则依照上述层数相同时候的原则进行判断,如果还不相同,则继续寻找其上一级父节点,并重复本过程。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710043245.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种图像查看方法及移动终端
- 下一篇:一种基于身份替代的隐私保护方法及系统