[发明专利]基于插值点的匿名隐私保护方法有效
申请号: | 201910340914.5 | 申请日: | 2019-04-25 |
公开(公告)号: | CN110162997B | 公开(公告)日: | 2021-01-01 |
发明(设计)人: | 汪小寒;张泽培;何增宇;王涛春;孙丽萍;郑孝遥;罗永龙 | 申请(专利权)人: | 安徽师范大学 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F30/18;G06K9/62 |
代理公司: | 芜湖安汇知识产权代理有限公司 34107 | 代理人: | 钟雪 |
地址: | 241000 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 插值点 匿名 隐私 保护 方法 | ||
本发明适用于隐私保护技术领域,提供了一种基于插值点的匿名隐私保护方法,该方法具体包括如下步骤:S1、对原始轨迹数据集Ts进行预处理,形成若干个在时间戳上一致的轨迹等价类Ecs;S2、对每个轨迹等价类中轨迹按照IMHDT距离度量进行聚类,每个轨迹等价类中构成若干个轨迹匿名组,其中每个匿名组中轨迹数量不少于k组;S3、对每个待匿名组中轨迹进行扰动,最终满足插值轨迹(k,δ)‑匿名。以轨迹时间戳为约束,将插值点限制在相应时间戳的轨迹段上,在匿名过程中减少了数据失真,满足发布数据隐私保护的前提下增加了数据可用性。
技术领域
本发明属于隐私保护技术领域,提供了一种基于插值点的匿名隐私保护方法。
背景技术
现代社会轨迹信息可以被带有GPS的手机,PDA,车载导航仪,智能穿戴设备等方便的进行采集和共享。用户从而可以方便的使用基于位置的服务1(LBS),比如“查找附近的加油站”,“记录我的运动轨迹”等,收集的轨迹信息可以用于商业决策,例如在位置信息密集地区开设超市等,通常这类地区具有较大的商业价值,从而使投资商效益最大化。也可用于城市规划等应用的开展。轨迹信息因为其蕴含特殊时空信息而存在巨大价值,但是这些信息也可以被恶意机构进行收集并分析,导致用户隐私泄露。
因此需要对发布数据集进行匿名处理,解决隐私泄露的问题。同时隐私保护体系所输出的数据不应该过度改变相应用户的轨迹的长度和持续时间等轨迹特征,如何在发布轨迹信息的同时既可以处理好发布数据的可用性,又可以保证个体轨迹不被攻击者识别出来是当下轨迹隐私保护应用需要关注的问题。现有许多用于保护轨迹数据发布隐私的方法中,大多数方法没有考虑用于发布的数据的可用性。
发明内容
本发明实施例提供了一种基于插值点的匿名隐私保护方法,以轨迹时间戳为约束,将插值点限制在相应时间戳的轨迹段上,在匿名过程中减少了数据失真,满足发布数据隐私保护的前提下增加了数据可用性。
为了实现上述目的,本发明提供了一种基于插值点的匿名隐私保护方法,所述方法具体包括如下步骤:
S1、对原始轨迹数据集Ts进行预处理,形成若干个在时间戳上一致的轨迹等价类Ecs;
S2、对每个轨迹等价类中轨迹按照IMHDT距离度量进行聚类,每个轨迹等价类中构成若干个轨迹匿名组,其中每个匿名组中轨迹数量不少于k组;
S3、对每个匿名组中轨迹进行扰动,最终满足插值轨迹(k,δ)-匿名。
进一步的,所述步骤S1具体包括如下步骤:
S11、定义轨迹处理分片值Pi;
S12、获取原始轨迹Tr的起止时间戳{tb,te};
S13、获取时间晚于起始时间tb且模Pi为0的时间戳ti,及时间早于终止时间te且模Pi为0的时间戳tj;
S14、将原始轨迹中截取为{ti,tj},并放入轨迹等价类D{i,j}。
进一步的,所述步骤S2具体包括如下步骤:
S21、将各轨迹等价类集合中的未聚类轨迹放入active集合,从active集合随机选择一条轨迹;
S22、计算active集合中其他轨迹到所述选定轨迹的IMHDT距离,将IMHDT距离最远的一条轨迹作为中心轨迹;
S23、计算active集合中其他轨迹到中心轨迹的IMHDT距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910340914.5/2.html,转载请声明来源钻瓜专利网。