[发明专利]一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法在审
申请号: | 201911148569.1 | 申请日: | 2019-11-21 |
公开(公告)号: | CN110968893A | 公开(公告)日: | 2020-04-07 |
发明(设计)人: | 习芷铖;桑应朋 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 王晓玲 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 pufferfish 框架 针对 关联 分类 数据 序列 隐私 保护 方法 | ||
本发明涉及一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法。首先引入Pufferfish框架制定严格的隐私保护定义,然后利用多维马尔可夫链模型准确描述数据之间的两种关联性,最后提出可实现的隐私保护机制添加合适的噪音保护隐私。本发明基于pufferfish隐私保护框架在二维关联数据的场景下制定隐私保护定义,采用多维马尔可夫链模型合理表示数据之间的二维关联性,并结合隐私保护定义提出可实现的添加噪音的机制,在实现聚合查询分析整体趋势的同时,保证每个个体在每一时刻的状态为隐私数据,攻击者无法区分。本发明同时考虑了个体之间的相关性以及每个序列内部的相关性这两种类型的隐私保护,能在使关联数据集可用的同时保护个体的隐私数据。
技术领域
本发明属于隐私保护与信息安全领域,更具体地,涉及一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法。
背景技术
差分隐私虽然是目前广泛应用的隐私定义,但是它并不能应用于数据关联的情况,因为模型假设数据集中每一个个体都是相互独立的,这样会导致将差分隐私直接应用于关联数据场景时并不能满足最初设定的隐私定义,造成隐私泄露。
Pufferfish的提出可以解决数据之间的关联性的情况,因为它可以利用集合D表示所有攻击者所拥有背景知识,即可以生成数据集的所有可能的概率分布,但是它的缺点在于缺乏具体的可实现的机制,因为需要考虑所有可能的概率分布,计算复杂度过高,且很难将所有分布全部表示出来。目前有一些针对具体数据集的可实用的机制,但是只能保护单个序列属性之间的相关性,并不能适用于本发明提供的场景。
而目前针对关联数据的隐私保护方法缺点在于均只考虑了一个维度的关联,比如个体与个体之间,或者属性与属性之间的关联情况。但是现实数据集中有很多是由多个相关序列组成的,比如不同人的时间序列数据,序列本身是高度关联的,并且不同人之间的序列也相互关联,所以现有的关联数据的隐私方法并不能适用于本发明提供的场景。
发明内容
本发明为克服上述现有技术中的缺陷,提供一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法,能解决多个关联分类序列的隐私保护问题,弥补了目前已有方案的不足。
为解决上述技术问题,本发明采用的技术方案是:一种基于Pufferfish框架的针对关联分类数据序列的隐私保护方法,首先引入Pufferfish框架制定严格的隐私保护定义,然后利用多维马尔可夫链模型准确描述数据之间的两种关联性,最后提出可实现的隐私保护机制添加合适的噪音保护隐私。本发明提出的方法能解决多个关联分类序列的隐私保护问题,弥补了目前已有方案的不足,在保护隐私的过程中首次同时考虑了个体之间以及个体的数据序列本身的关联性,引入了Pufferfish框架,基于pufferfish隐私保护框架在二维关联数据的场景下制定隐私保护定义,采用多维马尔可夫链模型合理表示数据之间的二维关联性,并结合隐私保护定义提出可实现的添加噪音的机制,在实现聚合查询分析整体趋势的同时,保证每个个体在每一时刻的状态为隐私数据,攻击者无法区分。同时考虑实现机制的效率问题,探究多维马尔可夫链的底层结构实现效率优化。本发明同时考虑了个体之间的相关性以及每个序列内部的相关性这两种类型的隐私保护,能在使关联数据集可用的同时保护个体的隐私数据,具有重大现实意义。
进一步的,所述的Pufferfish框架包括三部分:Secret S:代表需要被保护的敏感信息合集,即用S来表示涉及个人隐私数据的一组隐私信息;Secret pair S_pairs:判别对的合集,代表了如何保护隐私信息,即需要保证攻击者无法区分其中的判别对si,sj;D代表可以生成数据集的所有可能概率分布的合集,代表了攻击者拥有的背景知识的多少,每一个θ∈D代表一种生成数据集的可能概率分布,在D中可以考虑数据之间关联性。
进一步的,所述的Pufferfish框架定义为如下所示:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911148569.1/2.html,转载请声明来源钻瓜专利网。