[发明专利]基于度优先的K-Anonymity匿名算法的数据处理方法有效
申请号: | 201010176282.2 | 申请日: | 2010-05-19 |
公开(公告)号: | CN101834872A | 公开(公告)日: | 2010-09-15 |
发明(设计)人: | 胡翔天;宫秀军;陈海亮;赵菲菲;刘新觅 | 申请(专利权)人: | 天津大学 |
主分类号: | H04L29/06 | 分类号: | H04L29/06;G06F21/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李素兰 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 优先 anonymity 匿名 算法 数据处理 方法 | ||
1.一种基于度优先的K-Anonymity数据匿名处理方法,该方法包括以下步骤:
对发布数据进行预处理:根据发布数据选择相应的准标识符,然后由准标识符确定泛化等级和建立与之对应的Lattice泛化格;
获取全局最优节点,包括以下步骤:
计算Lattice中所有节点的度,即该节点的父节点的个数和该节点子节点的个数的乘积;
从Lattice泛化格中找到度最大的节点,判断该节点是否满足K-匿名:
如果该节点满足K-匿名,则从Lattice泛化格中删除该节点及其所有祖先节点;
查找K-min集合,判断该集合中是否有该节点的祖先节点,若有,删除保存所有泛化策略最低高度的K匿名节点的集合K-min集合中的该节点的祖先节点,若无,则不操作;最后把该节点保存到K-min集合中;
如果该节点不满足K-匿名,则从Lattice中删除该节点,并删除该节点的所有子孙节点;
计算K-min集合中节点的信息损失量;
将信息损失量最小的节点作为全局最优节点;
将所有发布数据按照最优节点的泛化方式进行泛化处理,并且将所得泛化处理结果进行发布。
2.如权利要求1所述的基于度优先的K-Anonymity数据匿名处理方法,所述从Lattice泛化格中找到度最大的节点的步骤,还包括以下步骤:
通过指令getMaxDegreeNode():返回泛化格中度最大的节点,该指令的具体实现过程是:计算所有节点的度,一个节点的度为该节点的所有直接父节点数与所有直接子节点数的乘积;找出度最大的节点并将其返回。这里所说的父节点为与该节点直接相连的上一层节点、子节点为与该节点直接相连的下一层节点。
3.如权利要求1所述的基于度优先的K-Anonymity数据匿名处理方法,所述计算K-min集合中节点的信息损失量的步骤,还包括以下步骤:
通过指令MinInfoLoss():计算KminNode中信息损失量最小的节点,
信息损失量的计算公式为:
N:表示元组集中地属性个数,DGHi表示N个属性中第i个属性的泛化等级,hi表示属性i的泛化程度。
4.如权利要求1或2所述的基于度优先的K-Anonymity数据匿名处理方法,所述从Lattice泛化格中找到度最大的节点的步骤,还包括以下步骤:在每次调用基于度优先的K-Anonymity数据匿名处理方法时,重新计算泛化格中所有节点的度,并且找到其中度最大的节点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010176282.2/1.html,转载请声明来源钻瓜专利网。