[发明专利]基于小波变换的差分隐私数据发布方法有效
申请号: | 201510041710.3 | 申请日: | 2015-01-27 |
公开(公告)号: | CN104573560B | 公开(公告)日: | 2018-06-19 |
发明(设计)人: | 管海兵;姚建国;马汝辉;李健;邓煜 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 上海新天专利代理有限公司 31213 | 代理人: | 张宁展 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于小波变换的差分隐私数据发布方法。通过把原始数据集的属性取值概括为预定义概括树结构中最顶层的取值,再利用概括树结构自顶向下的细分取值,一步一步把概括化的属性值转化为细分的属性值。在选择属性进行细分的选择算法上,利用已有的指数加噪方法;在叶子节点的加噪中引入了小波变换的加噪方法,使得在满足差分隐私保护的前提下,尽量减少新发布数据集相对原始数据集的噪音。本发明结合小波变换和指数机制协同加噪,有效的减少了在对原始数据集加噪过程中噪音的累积,并且符合差分隐私保护的定义,减少了隐私保护的代价,有效提高了差分隐私保护后数据集的利用率。 1 | ||
搜索关键词: | 小波变换 隐私保护 原始数据集 隐私数据 树结构 噪音 发布数据 选择算法 叶子节点 一步一步 自顶向下 数据集 预定义 再利用 最顶层 发布 协同 引入 转化 | ||
【主权项】:
1.一种基于小波变换的差分隐私数据发布方法,把原始数据集的属性取值概括为预定义概括树结构中最顶层的取值,再利用概括树结构自顶向下的细分取值,逐步把概括化的属性值转化为细分的属性值,其中,在选择属性进行细分的选择算法上,利用已有的指数加噪方法,在叶子节点的加噪中引入小波变换的加噪方法,使得在满足差分隐私保护的前提下,尽量减少新发布数据集相对原始数据集的噪音其特征在于:该方法具体包括以下步骤:步骤1、初始化原始数据集:根据预定义的概括树结构将原始数据集各个样本中的属性值转化为概括树中最顶层的取值;步骤2、自顶向下进行属性值的细分,在所有属性中选取一个属性进行细分,根据细分后的属性取值,分割整个样本;步骤3、判断细分次数是否达到上界,即细分到叶子节点,如是则进入步骤4,否则,返回步骤2;步骤4、加噪叶子节点:各个叶子节点上样本的数目组合成一个分布,通过小波变换f,将分布的取值,即叶子节点上样本的数目,转化为小波系数,对小波系数进行拉普拉斯加噪后,利用小波变换的逆f‑1把小波系数转化为新的分布值,即最终加噪后的分布取值;具体的加噪方法如下:步骤4.1、对原始数据分布T进行向量空间的映射,在一维的向量空间中,映射为一维的向量M,即将原始数据分布T中的vn转化为M中的cn,向量M个数为2l;步骤4.2、利用小波变换f将M转化为小波系数,记小波系数为ci,i∈[0,2l];步骤4.3、利用拉普拉斯机制对小波系数加噪,记加噪后的小波系数为ci',i∈[0,2l];步骤4.4、利用ci',i∈[0,2l]以及小波变换的逆f‑1反推出加噪后的向量分布M',即将ci'i∈[0,2l]转化为vn',最终对外发布M';步骤5、发布新数据集,该新数据集的属性与原始数据集的属性相同,其属性的取值为步骤4中各个叶子节点上该属性的取值,对应的样本数目则是各个叶子节点加噪后的分布取值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510041710.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种无线读码器
- 下一篇:一种防拷贝Soc启动方法及芯片