[发明专利]时间-空间型的轨迹大数据差分隐私保护方法在审
申请号: | 201810053113.6 | 申请日: | 2018-01-19 |
公开(公告)号: | CN108763947A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 郭宇春;刘翔;陈一帅 | 申请(专利权)人: | 北京交通大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F17/30 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 黄晓军 |
地址: | 100044 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 大数据 均方误差 近似度 前一时刻 隐私保护 子区域 发布 个人隐私数据 数据预处理 发布数据 轨迹数据 记录信息 数据发布 用户轨迹 用户历史 预算分配 可用性 输出 可用 噪声 泄露 预算 | ||
本发明实施例提供了一种时间‑空间型的轨迹大数据差分隐私保护方法。包括:数据预处理得到用户轨迹大数据集;对轨迹大数据集中的每个子区域进行预算分配,计算每个子区域在近似度计算阶段和数据发布阶段的可用预算;对轨迹大数据集进行近似度计算,计算当前时刻的数据与前一时刻的数据之间的均方误差;根据近似度计算结果判断是否发布数据,若均方误差大于当前时刻的数据的发布误差,则发布当前时刻的数据,加入Laplace噪声后输出,若均方误差不大于当前时刻的数据的发布误差,则不输出,并将前一时刻的数据作为当前时刻的数据。本发明对轨迹数据集中个人隐私数据进行有效保护,使得任意一个用户历史记录信息不会被泄露,同时数据仍具有较高的可用性。
技术领域
本发明涉及大数据处理技术领域,尤其涉及一种时间-空间型的轨迹大数据差分隐私保护方法。
背景技术
轨迹大数据是一类大数据集合,记录了个人用户一段时间内在地理空间中的位置变化信息。
匿名化处理是将数据中包含个人用户身份信息的内容删除,如:姓名,身份证号,用户名等。
k-anonymity是一种匿名化的模型,主要使用泛化和隐匿的手段,保证任意查询条件下至少有k名用户。
l-diversity是一种匿名化的模型,主要使用泛化和隐匿的手段,保证任意查询条件下至少有l种不同类型的用户。
ε-differential privacy是一种隐私保护模型,将数据中加入随机噪声,保证任意一名用户的信息无法被识别。
随着导航系统的不断发展,带有定位功能的电子设备已经被广泛应用在各行各业。用户地理位置的时间空间变化信息构成了轨迹大数据集。研究人员对数据集中人群的行为特征进行分析,可以得到人群的移动模式,为道路流量预测和控制、城市交通规划、交通导航等提供数据支持。与此同时,用户的历史出行记录往往包含着个人用户的家庭住址、工作地点等敏感内容,在进行大数据分析时,需要保证个人用户的敏感信息不被泄露。目前,数据公司在采集到用户数据之后,会对用户数据进行匿名化处理,即将用户的身份信息如真实姓名、身份证号、用户名等内容删除。但是不同用户的行为轨迹往往有很大的差别,攻击者如果已知用户曾经访问过某些地点,结合匿名化后的数据内容,仍然能够对用户进行识别。这种反匿名化的手段曾成功破解AOL(美国在线)公开的用户搜索记录大数据集。针对日益严重的用户隐私泄漏问题,研究人员提出了多种解决手段,如k-anonymity,l-diversity等方法,这些方法的基本思想都是将时间和空间划分为若干小区间,并加入一些伪数据,保证任意时空区间组合下,均包含有多名用户,保证攻击者无法从中识别出某一特定用户。但是这两种方法算法复杂度高,不易实现。
现有技术中针对上述问题对轨迹数据进行隐私保护的一种方法为:使用差分隐私技术对个人隐私进行保护。该技术主要通过在轨迹大数据中加入Laplace随机噪声对真实数据进行干扰,使得个人轨迹记录无法被推测出来。Liyue Fan等人提出一种基于差分隐私的FAST算法。该算法使用固定的噪声预算ε,针对数据集整体的变化趋势,自适调整在时间维度上的采样步长,实现了对时间长度有限的轨迹数据保护。该算法的主要缺点为无法对时间长度无穷的数据集进行有效保护。Georgios Kellaris等人提出ω-eventε-differential privacy(ω时间-差分隐私)差分隐私保护技术,对时间长度无穷的轨迹数据集使用差分隐私技术对个人隐私数据进行保护。该技术使用一个长度为ω的窗在时间轴上移动,保证窗内的隐私总预算为ε固定不变。根据区域数据的整体变化情况,决定是否消耗预算并公布发布数据内容。该算法主要的缺点是数据的可用性较差。
发明内容
本发明的实施例提供了一种时间-空间型的轨迹大数据差分隐私保护方法,以解决针对时间长度无穷的轨迹大数据集进行隐私保护的问题。
为了实现上述目的,本发明采取了如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京交通大学,未经北京交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810053113.6/2.html,转载请声明来源钻瓜专利网。