[发明专利]区分准标识符属性的二次k‑匿名隐私保护算法有效
申请号: | 201610361877.2 | 申请日: | 2016-05-26 |
公开(公告)号: | CN106021541B | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 吴响;王换换;臧昊;俞啸 | 申请(专利权)人: | 徐州医科大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F21/62 |
代理公司: | 南京钟山专利代理有限公司32252 | 代理人: | 李小静 |
地址: | 221004 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 区分 标识符 属性 二次 匿名 隐私 保护 算法 | ||
1.一种区分准标识符属性的二次k-匿名隐私保护方法,其特征在于:
1)Sn=Incognito(T,CQI,k),Sn表示分类型属性已经进行泛化的数据集,T表示需要被泛化的数据集,CQI表示分类型准标识符集,k表示匿名约束条件;
2)空队列result,空节点node;
3)遍历Sn进入以下循环:
数据集
Dj是存放全泛化后的数据表;
读取Sn中一个节点插入到node;
根据node泛化数据集T得到T′;
遍历T′,进入以下循环:
使用Ti′存储T′中第i个等价类;
MDAV(Ti′,NQI,k),Ti′表示需要被聚类的数据集,NQI表示要进行聚类的数值型属性,k表示匿名约束条件;
Dj=Dj∪Ti';
计算信息损失,插入到result;
4)比较result中信息损失,得到信息损失最小的Dj;
5)T”=Dj,返回T”。
2.根据权利要求1所述的区分准标识符属性的二次k-匿名隐私保护方法,其特征在于:Incognito(T,CQI,k)分类型属性泛化的具体步骤如下:
1)形成单属性泛化候选节点表C1和边表E1;
2)使用一个空队列queue取出C1中所有根节点,对queue所有节点进行等价类计算;
3)判断是否满足k-匿名,如果节点满足,则对此点以及其所有的子节点进行标记,如果不满足,则将此点从C1中删除,并把其子节点插入队列queue中;
4)重复步骤3),直到把C1中所有不满足的节点删除,并使删减后的C1和E1形成新的表C2和E2;
5)重复步骤2)、3)、4)直到得到删减后的Cn;
6)Sn={Cn所有节点}
7)返回Sn。
3.根据权利要求1所述的区分准标识符属性的二次k-匿名隐私保护方法,其特征在于:MDAV(Ti′,NQI,k)数值型属性泛化的具体步骤如下:
1)判断数据集中元组的个数是否大于2k-1,若大于,则继续步骤2),否则,返回数据集Ti′,并找到其质心;
2)数据集Ti′中按NQI找出距离最远的两元组r、s;
3)以r为质心,找到离r最近的k-1条元组形成等价类C,更新质心,并从数据集Ti'中删除这k条元组,放入集合群{Q}中;
4)以s为质心重复步骤3);
5)判断数据集Ti′中剩余的元组数目是否大于2k-1,若大于重复执行2)、3)、4);否则,return,返回数据集Ti′,并找到其质心;
6)以其质心的准标识符属性值代替其等价类中的元组的准标识符属性值;
7)返回Ti′。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于徐州医科大学,未经徐州医科大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610361877.2/1.html,转载请声明来源钻瓜专利网。