[发明专利]基于演进的数据流的自适应统计数据去标识在审
申请号: | 201880073071.0 | 申请日: | 2018-12-17 |
公开(公告)号: | CN111344708A | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | A·格考拉拉斯-迪瓦尼斯 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06N3/08;G06N5/02 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 刘都;于静 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 演进 数据流 自适应 统计数据 标识 | ||
一种动态地改变应用于数据集的数据去标识规则集以用于去标识数据的系统,所述系统包括至少一个处理器。所述系统周期性地监视从在一个条件集下根据数据去标识规则集被去标识的数据导出的数据集。相对于所监视的数据来评估针对数据去标识规则集的条件集,以确定数据去标识的适用性。响应于评估指示用于数据去标识规则集的条件的集合中的一个或多个条件不再被满足,动态地改变数据去标识规则集的一个或多个规则。本发明的实施例还可以包括用于以与上述基本相同的方式动态地改变应用于数据集的数据去标识规则集以去标识数据的方法和计算机程序产品。
技术领域
本发明的实施例涉及数据访问,并且更具体地,涉及动态地适配数据流中的数据去标识。
背景技术
数据去标识是转换数据集中的值以保护个人可标识的信息的过程,其中没有合理的基础来相信数据集中剩余的信息可以用于重新标识个体。
根据1996年美国健康保险携带和责任法案(HIPAA),用于去标识与个人健康信息有关的数据集的可接受的方式包括使用安全港列表(Safe Harbor list)和使用专家确定。这些方式中的每一个主要依赖于数据去标识规则集来提供数据保护。其他合法隐私框架通过考虑将数据去标识规则集应用于数据集的原始数据值来采用类似的方法以便保护个人数据。
数据去标识规则集通常是:通过以下群体密度/群体唯一性标准来构建;基于数据的分布(例如,涉及某个区域的公民的数据);以及基于针对公共可用的数据集(例如,群体普查数据、黄页、在obituaries中报告的死亡、开放数据等)的成功三角测量攻击的可能性。
用于导出用于保护数据集的数据去标识规则的这些准则中的每一个准则是基于可在任何时间点改变的信息,由此使得先前充分去标识的数据集(给定特定数据去标识规则集)易受新的重新标识和敏感信息公开攻击的影响。
数据去标识规则可能变得不足以保护个人的隐私的原因是数据去标识规则是静态的。换言之,数据去标识规则由隐私专家基于其对于是公开可用信息(即,在它们检查数据集的点处)的知识、然后包含在数据集中的数据、以及然后与攻击者的感知能力有关的不同假设的有效性(即,认为攻击者可能具有以便违背数据隐私的背景知识)来导出。领域专家在应用其规定的去标识规则之后评估数据集中的隐私级别时合理的所有这些假设可以在稍后的任何时间点被无效,从而使数据易受新的隐私攻击。
虽然专家确定伴随有到期日期(通常是2-3年),但到期日期是以年为单位计算的,并且不保证规定的数据去标识规则将不会基于在中间变化的数据和知识而变得过时。由于许多开放数据主动方存在于世界各地,这可能导致过多的数据集变得在线可用并且现有数据集用更新的信息来更新。由此,攻击者越来越容易违反由个人特定数据集中的静态数据去标识规则所提供的隐私。
发明内容
根据本发明的一个实施例,一种系统动态地改变应用于数据集的数据去标识规则集以用于去标识数据,并且包括至少一个处理器。该系统周期性地监视数据集,数据集是从在一个条件集下根据数据去标识规则集被去标识的数据中导出的。相对于所监视的数据评估用于数据去标识规则集的条件集,以确定数据去标识的适用性。响应于评估指示用于初始数据去标识规则集的条件集中的一个或多个条件不再被满足,动态地改变数据去标识规则集的一个或多个规则。本发明的实施例还可以基于机器学习动态地改变数据去标识规则集的一个或多个规则。本发明的实施例可进一步包括用于以与上述基本相同的方式动态地改变应用于数据集的规则集以对数据进行去标识的方法和计算机程序产品。
这提供了一种机制,该机制连续地(例如,实时地)或周期性地评估由统计专家做出的假设的有效性,并且在必要时适配数据去标识规则以便维持高水平的隐私保护。可以基于机器学习来适配数据去标识,以提供对数据去标识的认知和智能适配。换言之,该机制通常基于适用的隐私要求和法律框架(例如,HIPAA Safe Harbor等)将重新标识风险维持在可接受的阈值以下。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880073071.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摄像透镜系统以及摄像装置
- 下一篇:由于中断纤维而具有弯曲点的可充胀医疗球囊