[发明专利]基于随机应答技术的通用数据发布隐私保护方法有效
申请号: | 201910558380.3 | 申请日: | 2019-06-26 |
公开(公告)号: | CN110309671B | 公开(公告)日: | 2022-12-20 |
发明(设计)人: | 周水庚;刘朝斌;陈世熹;关佶红 | 申请(专利权)人: | 复旦大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/16 |
代理公司: | 上海正旦专利代理有限公司 31200 | 代理人: | 陆飞;陆尤 |
地址: | 200433 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 应答 技术 通用 数据 发布 隐私 保护 方法 | ||
本发明属于隐私保护技术领域,具体为一种基于随机应答技术的通用数据发布隐私保护方法。本发明基于随机应答技术,利用矩阵分解方法与克罗内克积性质,将重构无偏估计结果的计算复杂度从指数级增长降为线性增长,实现无偏估计结果的误差最小化,并允许为每个属性单独设置隐私保护参数,有效提高计算效率、数据可用性和应用灵活性。本发明方法支持单敏感属性和多敏感属性的数据发布,所述敏感属性包括布尔型属性、分类型属性和数值型属性;本发明能够为医疗、金融、生物信息和交通等领域的科研与管理提供高效、灵活的数据发布隐私保护机制,有助于在数据发布过程中保护数据隐私的同时,保留发布数据有用信息,促进数据的共享共用。
技术领域
本发明属于隐私保护技术领域,具体涉及数据发布的隐私保护方法。
背景技术
数据发布应用中,数据发布者存在两个主要关切:一个是保护个体敏感数据隐私不被泄露,另一个保留原始数据中存在的统计规律,以确保发布数据的可用性。隐私保护技术是同时实现这两个主要关切的关键保证。如医院拥有大量病人的病历数据,这些数据需要提供给医生、科研工作者及社会管理人员,用于找出数据中的规律特点,为研究疾病治疗或预防方法提供服务。但是,直接发布这些数据,将会导致病人疾病等隐私信息的泄露。因此,需要通过隐私保护技术对原始数据或查询结果进行转换处理。数据的转换处理包括输入扰动和输出扰动两种基本方法。输入扰动方法主要对原始数据集进行调整处理,并基于调整处理后的数据集进行查询处理;输出扰动方法主要基于原始数据集计算查询结果,然后对查询结果进行调整处理或拒绝可能泄露隐私的查询请求。本发明主要聚焦输入扰动方法研究。
泛化技术和随机应答技术是输入扰动方法的代表性技术。泛化技术主要通过分组方式,让某一个体的敏感属性值无法与同组内其他个体的敏感属性值进行区分,以达到隐私保护的目的,典型的泛化技术方法有k-anonymity方法、l-diversity方法、t-closeness方法和Anatomy方法。但是,泛化技术的数据发布形式不标准,数据可用性较差。随机应答技术主要按照一定策略对原始数据进行随机扰动,在保证发布数据可用性的同时,让攻击者无法知晓目标个体的敏感属性值。随机应答技术方法对原始数据进行随机扰动后发布,实现攻击者不能以高于预先设定的概率推断出原始数据中是否包含目标个体的敏感数据,同时发布数据中能够有效保留原有的数据统计规律,以保证数据可用性。常用的随机应答技术扰动方法有Retention Replacement扰动方法和Flipping扰动方法。与泛化技术相比,随机应答技术的数据发布形式较为统一,能够提供更好的隐私保护强度,但现有基于随机应答技术的方法还存在隐私参数设置不够灵活、计算复杂度较高等问题。
发明内容
本发明的目的在于提出了一种隐私参数设置灵活、计算复杂度低的通用的数据发布隐私保护方法。
本发明提供的通用的数据发布隐私保护方法,是基于随机应答技术的。该方法支持单敏感属性和多敏感属性的数据发布,所述敏感属性包括布尔型属性、分类型属性和数值型属性;允许为每个属性单独设置隐私参数,其无偏估计结果的重构时间与查询维度(即查询涉及的敏感属性数量)呈线性相关,且能够实现无偏估计结果的误差最小化。
本发明提出的通用数据发布隐私保护方法,给出了各类型属性数据的具体扰动方法;尤其针对分类型属性数据的Flipping扰动方法在结果重构方面的不足,提出了Flipping扰动的无偏估计结果重构新方法,有效减小估计误差。
本发明提出的通用数据发布隐私保护方法,包括如下几个方面:
(1)将每一个敏感属性进行独立处理,包括数据扰动和数据重构;
(2)基于矩阵分解方法与克罗内克积性质,将求解向量中所有元素值转化为只求解其中一个元素值,实现无偏估计结果的重构时间与查询维度呈线性相关,有效化解传统方法呈指数级增长的难题;
(3)将无偏估计结果误差最小化作为求解重构矩阵的约束条件,以实现重构结果误差最小化的目标;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于复旦大学,未经复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910558380.3/2.html,转载请声明来源钻瓜专利网。