[发明专利]一种基于信念网络的靶向型隐私保护数据发布方法有效

专利信息
申请号: 202110050995.2 申请日: 2021-01-14
公开(公告)号: CN112822004B 公开(公告)日: 2022-12-06
发明(设计)人: 周志刚;白增亮;苗钧重;余翔湛 申请(专利权)人: 山西财经大学
主分类号: H04L9/00 分类号: H04L9/00;H04L9/40
代理公司: 太原申立德知识产权代理事务所(特殊普通合伙) 14115 代理人: 程园园
地址: 030006 *** 国省代码: 山西;14
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 信念 网络 靶向 隐私 保护 数据 发布 方法
【说明书】:

发明数据发布领域,具体涉及一种基于信念网络的靶向型隐私保护数据发布方法。针对以知识挖掘为目标的大数据多源增量发布场景中对数据可用性与隐私保护的协同优化问题,提出一种基于信念网络的靶向型隐私保护数据发布方法,代替发布原始数据,通过抽样、生成、转换等操作发布符合隐私‑效用的信念网络,在解决个体数据隐私泄露的同时极大地提升了数据共享的效率;为防范敌手通过滥用知识挖掘技术对隐私信息的过度分析以及通过异源数据的印证攻击,提出(d,l)‑privacy隐私保护架构,柔性地化解了隐私保护强度的提升对数据可用性的影响,并通过来自多个应用域的4个公开数据集来实证该方法的有效性。

技术领域

本发明数据发布领域,具体涉及一种基于信念网络的靶向型隐私保护数据发布方法。

背景技术

随着“互联网+”行动计划的稳步实施,将云计算、物联网、人工智能等新型技术与各行各业结合起来,极大地撬动了以“大数据分析、内容咨询服务”为核心的巨量市场。在合作共赢、共享经济的大背景下,产业链上下游企业通过数据共享,分析产品从原料购进到销售的各个环节,能够有效减小产能过剩的风险;不同产业的公司也可以通过信息发布与共享的方式展开多元化产业合作,从而减缓单一领域产品受市场周期变化的冲击。尽管数据融合分析可以为企业提供竞争优势,但据研究机构Gartner对144名全球知名企业首席审计主管的调查显示,随着企业间的信息共享,数据分析的安全风险正在加剧,70%的受访者表示为避免隐私泄露所带来的负面影响,如何保护数据隐私是各方最关注的问题。

隐私保护的数据发布[1](Privacy-Preserving Data Publishing,简称PPDP)作为数据挖掘技术从数据中安全、合法依规提取知识的必要技术前件,在过去几十年中受到相当大的关注。PPDP可以归约为隐私挖掘与敏感信息匿名化的博弈:假设目标对象T具有一组信息属性和一个敏感属性,其中信息属性值AI为可公开属性(又称为信息属性),而敏感属性值AS(又称为隐私属性)需要被匿名处理。在数据发布的过程中要求确保没有人可以根据发布的匿名数据以高于阈值的概率猜测出由可公开属性AI到敏感属性AS的映射关系。在大数据场景中,PPDP的内涵得到了扩展。由于数据发布的目标是分析数据分布、探索数据之间的关系以及挖掘隐藏在大数据中的新知识,因此,其中所包含的敏感统计信息(下称为宏隐私,相应地,称个人敏感信息为微隐私)也需要进行相应的匿名化处理。

多源数据安全融合以隐私保护作为合作基础,打破信息孤岛的壁垒,在更广泛数据集上挖掘知识产生协同,并最终按需实现有限开放的信息共享。纵观国内外文献,可以从隐私度量指标、隐私计算和面向多源数据融合的隐私保护技术3个方面进行梳理。

k-匿名(k-anonymity)要求对所发布的数据中的每一条记录至少存在其它k-1条不能与之区分的记录。其中,k作为“匿名度”直接表征了目标数据被保护程度的强弱。康奈尔大学的Machanavajjhala等人提出多样性(1-diversity),该策略在k匿名的标准下限制每一个由信息属性划分的等价类中所对应的敏感属性至少包含个不同的值。为了实现上述数据匿名策略,数据发布方通常采用数据泛化、插入噪声数据、数据分割这三类方法对数据进行处理。然而,伪装的数据需要“精心”设计,正如敌手可以以发布的宏观统计数据为背景知识,通过基于统计推理的攻击消除添加的伪数据。

此外,从k-匿名到多样化性再到其后演化的诸多变种都围绕弥补k匿名无力对抗背景知识攻击来展开。对此,与之并行的差分隐私方案成为一个新的突破点。Dwork等人提出基于ε-差分隐私(ε-differential privacy)的隐私保护方案,其对数据隐私的保护与攻击者掌握的背景知识无关。该准则利用指定参数ε表征添加噪声的程度,遗憾的是,在面对高维稀疏数据时,差分隐私已被证明将严重的降低数据可用性。为了防止统计推测攻击,普渡大学和ATT实验室的李宁辉等人提出t-相近性(t-Closeness)原则,在多样化的基础上,考虑了敏感属性值的分布问题,该策略将t作为“相近程度”的距离度量,表征在匿名数据中,敏感属性值的分布与整体大数据中该属性值分布的相近程度。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山西财经大学,未经山西财经大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110050995.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top