[发明专利]一种用于局部差异隐私下的边际释放的一致自适应边际在审
申请号: | 202010778159.1 | 申请日: | 2020-08-05 |
公开(公告)号: | CN112052475A | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 王之涵 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06K9/62 |
代理公司: | 北京权智天下知识产权代理事务所(普通合伙) 11638 | 代理人: | 蔡金花 |
地址: | 710071 陕*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 局部 差异 隐私 边际 释放 一致 自适应 | ||
本发明公开了一种用于局部差异隐私下的边际释放的一致自适应边际,属于局部差异隐私技术领域,包括以下步骤:S1:聚合器将总体随机分为大小相同的m个组;S2:选择一组m个边际集和要使用的FO协议;S3:聚合器将每个用户分配给边际之一,并通知用户应报告哪个边际;S4:每个用户将其私人价值v投影到他要报告的边际上,并通过FO报告v的预测值;S5:服务器在接收到用户的报告后,使用FO的聚合算法来获取嘈杂的边缘表;S6:给定这些嘈杂的边际/视图,可以直接计算一些三向边际;S7:生成k向边距;本发明对于局部差分隐私下的边际释放问题,引入了CALM,当存在非二进制属性时,CALM也适用。
技术领域
本发明属于局部差异隐私技术领域,具体涉及一种用于局部差异隐私下的边际释放的一致自适应边际。
背景技术
现有用于局部差异隐私下的边际释放方法在高维环境中表现不佳,更糟糕的是,某些方法会产生非常昂贵的计算开销。
发明内容
为解决上述背景技术中提出的问题。本发明提供了一种用于局部差异隐私下的边际释放的一致自适应边际,具有提高有效性和效率的特点。
为实现上述目的,本发明提供如下技术方案:一种用于局部差异隐私下的边际释放的一致自适应边际,包括以下步骤:
S1:聚合器将总体随机分为大小相同的m个组;
S2:选择一组m个边际集和要使用的FO协议;
S3:聚合器将每个用户分配给边际之一,并通知用户应报告哪个边际;
S4:每个用户将其私人价值v投影到他要报告的边际上,并通过FO报告v的预测值;
S5:服务器在接收到用户的报告后,使用FO的聚合算法来获取嘈杂的边缘表;
S6:给定这些嘈杂的边际/视图,可以直接计算一些三向边际;
S7:生成k向边距。
本发明中进一步的,所述步骤S1中,分组的具体步骤为:
S11:对混合属性数据表可行的差分隐私保护方法
为加强隐私保护和提高数据可用性,提出一种可对混合属性数据表执行差分隐私的数据保护方法,该方法首先采用ICMD聚类算法对数据进行聚类匿名,然后在此基础上进行ε-差分隐私保护,ICMD聚类算法对数据表中的分类属性和数值属性采用不同方法计算距离和质心,并引入全序函数以满足执行差分隐私的要求,通过聚类,实现了将查询敏感度由单条数据向组数据的分化,降低了信息损失和信息纰漏的风险,
对于查询函数f,若算法A有则算法A满足ε-差分隐私,其中,Δf表示查询函数的敏感性,指的是查询函数f作用于邻近数据集时产生的最大距离差,添加拉普拉斯噪声引起的误差
S12:混合型数据表中距离和质心计算
现有数据大多数为混合型数据表,即表中的数据属性既有数值型又有分类型,针对不同属性的数据有不同的距离计算和质心求解方法,采用单一的方法往往会造成信息丢失、质心偏差等问题,因而提出一种针对混合型数据表的距离计算和质心求解方法,
设混合型数据集D以及X,Y为数据集D中的记录,每一个记录具有p维分类属性和q维数值属性,计算数据记录X,Y的距离d(X,Y)c,首先分别计算其分类属性距离d(X,Y)n,定义如下:
S121:分类距离
对于数据表中的任意记录X,Y,假设数据表含有p维分类属性,则记录X,Y的分类属性部分的距离定义为:
其中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010778159.1/2.html,转载请声明来源钻瓜专利网。