[发明专利]一种基于方向统计的市民轨迹隐私保护技术在审
申请号: | 201510970243.2 | 申请日: | 2015-12-23 |
公开(公告)号: | CN106910333A | 公开(公告)日: | 2017-06-30 |
发明(设计)人: | 李方平;李扬;孙兆才 | 申请(专利权)人: | 神州数码信息系统有限公司 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;H04L29/06;H04L29/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100085 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 方向 统计 市民 轨迹 隐私 保护 技术 | ||
技术领域
本发明属于大数据分析范畴,更准确的讲,涉及到方向统计学、轨迹计算的相关技术。
背景技术
在智慧城市中,对市民轨迹进行大数据分析,可以得到很多有价值的信息,最终更好的服务于市民。例如:通过车流来预测交通状况,通过人流来对突发事件进行预警,也可以通过个人的轨迹进行个性化画像。在给市民方便的同时,安全问题也是一个不容忽视的重要问题。有别于传统统计学,方向统计学(directional statistics)更关注方向变化信息,例如时钟、星空等,而不是地理位置信息。利用方向统计学对轨迹数据进行聚类分析,能够得到市民轨迹的关键特征。同时由于忽略了位置信息,也能更好的进行隐私保护。但是目前相关的方案和专利还没有。
发明内容
本发明的目的是通过核聚类技术,对智慧城市中大量的市民轨迹数据进行隐私保护。本发明的技术要点如下:
1、轨迹数据的表示问题:常见的轨迹分析一般采用图方式进行表示与计算,这种方式存储量大,噪声多。同时,在轨迹计算中,位置变化的信息(频率、方向)可能更重要,传统的表示方法不能突出这些信息。本发明采用轨迹空间模型(TSM)来表示这种位置变化信息。假设(a1,a2)为图G中的两点,统计二者的位置改变次数,作为一个特征。经过此变换,一个n×n的轨迹图,就表示为一个2×n的向量。这种表 示存储量小,且更能反映位置变化信息;
2、球聚类问题:在TSM模型上,轨迹向量可以表示在一个球面上,利用方向统计对该向量进行聚类分析,常用的方法包括球形k-means、基于vmf模型的EM算法等。但是这些方法都不能解决“噪声维”问题,不适合处理高维数据。本发明利用“熵”平衡的方法来给不同的维度进行加权处理,重要的维度特征突出,相反,“噪声”维则抑制。
附图说明
图1为本发明的流程图。
具体实施方式
参见图1,本发明的主要步骤如下:
步骤1:对市民轨迹数据进行匿名、扰乱等预处理,隐去ID信息;
步骤2:用TSM模型对市民轨迹重新表示,隐去位置信息;
步骤3:基于方向统计对轨迹图进行聚类分析;
步骤4:基于聚类结果,重新对市民轨迹进行表示,并抽取特征。
最后所应说明的是,以上实施例仅用以说明而并非限制本发明所描述的技术方案;因此,尽管本说明书参照上述的实施例对本发明已进行了详细的说明,但是,本领域的普通技术人员应当理解,仍然可以对本发明进行修改或者等同地替换;而一切不脱离本发明的精神和范围的技术方案及其改进,其均应涵盖在本发明的权利要求范围当中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于神州数码信息系统有限公司,未经神州数码信息系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510970243.2/2.html,转载请声明来源钻瓜专利网。