[发明专利]数据压缩方法、装置、设备及存储介质在审
申请号: | 202111139422.3 | 申请日: | 2021-09-26 |
公开(公告)号: | CN113849471A | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 章国政;乔柏;常红珍 | 申请(专利权)人: | 中国联合网络通信集团有限公司 |
主分类号: | G06F16/174 | 分类号: | G06F16/174;G06K9/62;G06F21/60 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 杨泽;刘芳 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据压缩 方法 装置 设备 存储 介质 | ||
本申请提供一种数据压缩方法、装置、设备及存储介质,该方法获取用户轨迹,对用户轨迹进行聚类处理,得到K个用户聚类,并确定每个用户聚类对应的压缩阈值,其中,每个用户聚类中包括一个或多个用户轨迹,其中,K为任意正整数;根据预设总隐私预算、用户聚类中的用户轨迹数量和用户轨迹总数量,确定每个用户聚类对应的隐私预算;针对每个用户轨迹,根据用户轨迹的待压缩点、起始轨迹点和终止轨迹点,确定用户轨迹对应的压缩阈值;根据压缩阈值,通过矢量数据压缩算法,对每个用户轨迹进行压缩处理,得到每个用户轨迹对应的近似路径;根据隐私预算,为每个近似路径添加噪声扰动,得到用户轨迹的目标压缩数据。
技术领域
本发明涉及通信技术领域,尤其涉及一种数据压缩方法、装置、设备及存储介质。
背景技术
近年来,群智感知(Crowd-Sensing)是结合众包思想和移动设备感知能力的一种新的数据获取模式,是通过人们已有的移动设备形成交互式的、参与式的感知网络,并将感知任务发布给网络中的个体或群体来完成,从而帮助专业人员或公众收集数据、分析信息和共享知识,然而,为了获取高质量的感知数据,需要招募大量的参与者去执行感知任务,导致感知成本太大,阻碍了移动群智感知应用的拓展,因此,需要对感知数据进行压缩。
目前,主要通过轨迹压缩算法来实现对用户轨迹感知数据的压缩,应用最为广泛的为有损压缩算法中的道格拉斯-普克(Douglas-Peuker,DP)算法,DP算法是一种矢量数据压缩算法,将轨迹近似抽象为一系列的轨迹点,通过计算所有轨迹点的垂直欧式距离并将其与预先设定的阈值比较来依次减少轨迹点数量来实现压缩的目的,该算法因其简单且性能高效的优点而被广泛应用于轨迹数据的压缩。
然而现有技术中的数据压缩方法缺少隐私保护,用户数据易泄露、隐私性差,且现有算法中预先设定阈值的不确定性以及不合理性,导致数据的可用性差。
发明内容
本申请提供一种数据压缩方法、装置、设备及存储介质,从而解决现有技术中的数据压缩方法缺少隐私保护,用户数据易泄露、隐私性差,且现有算法中预先设定阈值的不确定性以及不合理性,导致数据的可用性差的技术问题。
第一方面,本申请提供了一种数据压缩方法,包括:
获取用户轨迹,对所述用户轨迹进行聚类处理,得到K个用户聚类,并确定每个所述用户聚类对应的压缩阈值,其中,每个所述用户聚类中包括一个或多个用户轨迹,其中,K为任意正整数;
根据预设总隐私预算、用户聚类中的用户轨迹数量和用户轨迹总数量,确定每个所述用户聚类对应的隐私预算;
针对每个用户轨迹,根据所述用户轨迹的待压缩点、起始轨迹点和终止轨迹点,确定所述用户轨迹对应的压缩阈值;
根据压缩阈值,通过矢量数据压缩算法,对所述每个用户轨迹进行压缩处理,得到每个所述用户轨迹对应的近似路径;
根据所述隐私预算,为每个所述近似路径添加噪声扰动,得到用户轨迹的目标压缩数据。
这里,本申请提供了一种数据压缩方法,该方法为一种满足差分隐私的用户轨迹批量压缩方法,首先对用户轨迹通过聚类处理进行聚类划分,根据聚类结果为不同聚类的用户轨迹分配不同的隐私预算,从而可根据不同聚类的隐私预算添加噪声,以提高数据压缩的隐私性,且保证了数据的可用性,保护用户的个人信息,通过聚类处理,可根据不同的用户及用户轨迹进行不同的噪声添加,可准确、有效地避免用户个人信息的泄露,另外,本申请在通过DP算法对用户轨迹进行压缩时,结合了用户轨迹的待压缩点、起始轨迹点和终止轨迹点来确定压缩阈值,避免了随机设置的压缩阈值导致的轨迹压缩率高、轨迹数据压缩之后可能会造成的数据不可用的问题,能够有效降低DP算法的压缩率,提高轨迹数据压缩之后可用性,并且能够很好的避免用户敏感信息的泄露,提高数据压缩的隐私性。
可选地,所述对所述用户轨迹进行聚类处理,得到K个用户聚类,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国联合网络通信集团有限公司,未经中国联合网络通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111139422.3/2.html,转载请声明来源钻瓜专利网。