[发明专利]一种基于轨迹分段的轨迹数据隐私保护方法有效
申请号: | 201911215832.4 | 申请日: | 2019-12-02 |
公开(公告)号: | CN111026930B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 李凤云;陈怡霖;毕远国;董嘉馨 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F16/9032 | 分类号: | G06F16/9032;G06F16/906;G06F16/909 |
代理公司: | 沈阳优普达知识产权代理事务所(特殊普通合伙) 21234 | 代理人: | 李晓光 |
地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轨迹 分段 数据 隐私 保护 方法 | ||
1.一种基于轨迹分段的轨迹数据隐私保护方法,其特征在于包括以下步骤:
1)对基于位置服务应用提供商积累的原始轨迹数据集运用基于轨迹分段填充的等价类划分算法:将其它等价类中位于当前等价类时间区间内的轨迹分段填充到当前等价类中;
2)对每个等价类运用基于轨迹分段聚类的聚类组构建算法:确定聚类组的开始时间并根据此时轨迹所处的位置点将等价类包含的所有轨迹划分为若干候选聚类组;遍历每个候选聚类组,确定聚类组的结束时间和组成该聚类组的轨迹集合,进而构建聚类组和处理加入聚类组的轨迹中位于聚类组时间区间外的轨迹分段;将当前等价类中没有加入聚类组的轨迹分割为多个轨迹分段,放入对应时间区间等价类;
3)将未加入聚类组的轨迹插入时间区间与之相同、空间位置最近的聚类组中;
4)对每个聚类组中每条轨迹上的每个位置点进行空间扰动,将每个聚类组都变成一个匿名轨迹集合,做为可直接发布的轨迹数据集;
步骤1)中轨迹分段填充包括以下步骤:
101)设E为轨迹数目小于阈值的等价类,其开始时间为i,结束时间为j;
102)从等价类集合ES中找到两个等价类E1,E2,满足E1的开始时间为i,结束时间为t,E2的开始时间为j+1,结束时间为t;
103)若存在这样的E1,E2,将E1中的轨迹分割为两段:时间位于[i,j]的轨迹分段和[j+1,t]的轨迹分段,并将他们分别放至对应的等价类中;
104)若不存在这样的E1,E2,则不对E进行处理。
2.根据权利要求1所述的基于轨迹分段的轨迹数据隐私保护方法,其特征在于步骤2)中确定聚类组的开始时间并根据此时轨迹所处的位置将等价类包含的所有轨迹划分为若干候选聚类组,具体为:
201)从等价类的起始时间开始,为等价类对应的轨迹集合在当前时刻的位置点集合进行k-means聚类;
202)若成功加入聚簇的位置点数目占总位置点数目的比例大于等于比例阈值,则在此刻聚类成功,该时刻即为聚类组的开始时间,每个聚簇对应的轨迹集合都为一个候选聚类组,结束当前操作;否则,视为聚类失败,将当前时刻加1;
203)若当前时刻大于等于等价类的结束时间,将该等价类中的所有轨迹放至聚簇失败的轨迹集合fT中,结束当前操作;否则继续判断能否聚类成功。
3.根据权利要求1所述的基于轨迹分段的轨迹数据隐私保护方法,其特征在于步骤2)中确定聚类组的结束时间和组成该聚类组的轨迹集合,进而构建聚类组和处理加入聚类组的轨迹中位于聚类组时间区间外的轨迹分段,包括以下步骤:
204)对每个候选聚类组不断聚簇:从初始聚簇时刻起判断该时刻的候选聚类组能否聚簇成功;
205)如果聚簇成功,则将当前时刻未加入聚簇的轨迹从候选聚类组中移除,将当前时刻加上采样间隔stride,继续进行聚簇;
206)如果聚簇失败,则组成该聚类组的轨迹集合为上次聚类成功的所有轨迹,聚类组的结束时刻的候选范围为上次聚簇成功时刻到当前时刻减1,最佳的结束时间应该满足以其为结束时间后当前等价类中位于聚类组时间区间外的轨迹分段尽可能都能放入现存的等价类中;
207)在确定当前聚类组的时间区间和组成该聚类组的轨迹集合后需要处理该轨迹集合中不在当前聚类组时间区间内的轨迹分段:将轨迹分段分割为多个更小的轨迹分段,加入对应的等价类中。
4.根据权利要求3所述的基于轨迹分段的轨迹数据隐私保护方法,其特征在于步骤204)中,判断候选聚类组能否聚簇成功的条件是,候选聚类组包含的轨迹在当前时刻构成的位置点集合中和位置点中心距离不超过聚簇半径的位置点数目大于等于匿名阈值k。
5.根据权利要求1所述的基于轨迹分段的轨迹数据隐私保护方法,其特征在于步骤2)中,将当前等价类中所有没有加入聚类组的轨迹分割为多个轨迹分段,放入对应时间区间等价类,包括以下步骤:
208)判断未加入到聚簇的轨迹的集合fT中包含轨迹的数量是否大于规定阈值;
209)若大于规定阈值,则将fT中的轨迹直接分为两段,其中前段是ES中存在的等价类E1,该等价类满足开始时间为fT的开始时间,结束时间为小于等于fT的结束时间且最接近fT的结束时间,后段作为一个新的等价类加入ES集合中;
210)若小于阈值,将fT中的轨迹全部分为多个轨迹分段:[startTime,time1],[time1+1,time2],...,[timei+1,timej],[timej+1,endTime],其中,除最后一个分段外,所有分段都在ES中存在对应时间区间的等价类;同时,存在时间区间为[timej+1,t]的等价类E1和时间区间为[endTime+1,t]的等价类E2(t大于endTime);轨迹分段的数量越少越好。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911215832.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:防猫眼装置及门体
- 下一篇:电网规划决策数据噪音识别与降噪方法及系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置