[发明专利]一种面向隐私保护的用户轨迹生成方法及系统有效
申请号: | 201911345902.8 | 申请日: | 2019-12-23 |
公开(公告)号: | CN111125764B | 公开(公告)日: | 2022-02-15 |
发明(设计)人: | 丁晓锋;金海;周文翔 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 隐私 保护 用户 轨迹 生成 方法 系统 | ||
1.一种面向隐私保护的用户轨迹生成方法,其特征在于,该方法包括以下步骤:
S1.将时间段t对应的位置元组数据流S所在区域范围划分为层次网格,采用Geohash算法对各个网格进行编码,得到每个位置数据元组的编码字符串;
S2.根据划分后的网格和所有位置数据元组的编码字符串,生成该元组数据流S对应的前缀层次树;
S3.将该元组数据流S划分为k段,根据第一隐私预算值εa对每段数据流进行采样,得到采样后的位置元组数据集{D′i},1≤i≤k;
S4.根据差分隐私的指数机制,将各个采样后的位置元组泛化到对应的划分区域内,得到泛化后的位置元组数据集
S5.通过第二隐私预算εb,对处于相同划分网格内的元组数据进行合并得到符合隐私保护要求的用户轨迹;
步骤S3包括以下步骤:
S31.以时间窗口长度T为单位,将用户位置数据流S划分为k个连续的分段D1,…,Di,…,Dk;
S32.根据第一隐私预算εa,计算每个分段Di的元组采样隐私预算εa,i,将其分配给对应分段,元组采样隐私预算εa,i计算公式如下:
S33.根据每段数据流Di分配到的隐私预算εa,i值,计算其对应的采样概率
S34.根据采样概率Pi,分别对每个分段数据流Di中的位置数据进行采样,整理采样后得到的流数据元组,并生成采样后的元组数据集D′1,…,D′i,…,D′k;
其中,s为界限常数,满足k为分段总数,i为分段编号;
步骤S4包括以下步骤:
S41.收集元组数据流S所在路网中的每个位置,组成位置域Γ;
S42.对于每个分段D′i,计算其每一个元组数据x′iz对于在位置域Γ的每个网格rj的权重分数q(x′iz,rj),计算公式如下:
其中,Pt[rj]表示网格节点rj所包含的访问者人数信息,Δdisijz表示网格节点rj与D′i中的元组x′iz所在的网格节点之间的距离,a是小于1的常数,由位置域的面积确定;
S43.使用差分隐私的指数机制,结合元组x′iz与周围网格的权重分数q(x′iz,rj),生成相应的泛化概率
S44.根据泛化概率Pijz将x′iz泛化到对应的网格rj中,得到元组数据集
其中,1≤z≤|D′i|,1≤j≤|Γ|,rj表示位置域Γ第j个网格;
步骤S5包括以下步骤:
S51.根据第二隐私预算εb的值,确定对应的元组合并级别level,该合并级别level代表元组要被合并到的网格的父节点的深度;
S52.定义k个空集合LRi,对于在每段位置数据集中,每个元组数据所在的网格节点的祖先节点anc进行集合的添加操作,即LRi=LRi∪{anc},最后构成对应的祖先节点集合LRi;
S53.对于祖先节点集合LRi中的每个元素pij,计算键值对字典
S54.根据隐私预算εb和键值对字典计算每个pijn作为合并候选网格的概率
S55.使用差分隐私指数机制,根据概率Pijn进行合并网格的选择;
S56.将每段位置数据集中,每个元组数据的经纬度位置信息替换为合并网格的位置信息,直至所有k段位置数据集完成元组合并操作,生成一条符合隐私保护要求的用户轨迹;
其中,pijn表示pij的第n个子节点,1≤n≤|child(pij)|,child(pij)为pij的子节点集合,表示中所有的元素个数计数,并且要满足的元素所在的网格与pijn存在交集关系,表示所在节点的所有兄弟节点的集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911345902.8/1.html,转载请声明来源钻瓜专利网。