[发明专利]一种大数据环境下的群体轨迹伴随模式在线分析方法和系统有效
申请号: | 201910655594.2 | 申请日: | 2019-07-19 |
公开(公告)号: | CN110580251B | 公开(公告)日: | 2023-01-17 |
发明(设计)人: | 王博;李超;郭承青;王维光;刘路;陈天然;庹宇鹏 | 申请(专利权)人: | 中国科学院信息工程研究所;国家计算机网络与信息安全管理中心 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/215 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 邱晓锋 |
地址: | 100093 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 环境 群体 轨迹 伴随 模式 在线 分析 方法 系统 | ||
本发明涉及一种大数据环境下的群体轨迹伴随模式在线分析方法和系统。该方法包括:设置群体轨迹伴随模式的阈值参数;对群体轨迹流数据进行切片,获得当前时间片的群体位置信息集合;构建基于spark的分布式高维索引树KD‑Tree;进行位置点的密度聚类,形成当前时间片的群体位置聚类快照簇集合Scs;根据当前群体轨迹伴随候选集SetAc是否为空,将Scs中的位置聚类快照簇加入SetAc中存在的伴随候选组或者新生成的轨迹伴随候选组;判断当前每个轨迹伴随候选组是否合格,如果合格则输出合格的群体轨迹伴随模式详情。本发明具有高吞吐量、实时性高、准确性高、扩展性好、高可配置性等优点。
技术领域
本发明涉及移动群体轨迹模式分析与监控领域,是一种实时获取移动智能终端产生的海量时空位置大数据,使用分布式算法对轨迹数据按时间片切分和聚类并进行群体轨迹伴随模式在线识别发现的方法,能够应用于群体移动轨迹伴随模式分析、特定群体活动监控、交通热点路线发现等方面。
背景技术
随着移动互联网的迅速发展,特别是以手机为代表的智能移动终端的普及,每时每刻产生着海量的移动群体位置信息,蕴含着大量用户日常生活习惯和生活圈的位置和时空轨迹数据。群体轨迹伴随模式是指一群移动对象在时空轨迹上表现出相同或相似的运动模式,并且该模式持续了一定时间长度。群体轨迹伴随模式在我们生活中普遍存在,例如一起乘坐公共交通工具的乘客、一起逛街的朋友等都形成了轨迹伴随模式。快速有效地对大数据规模下的群体移动轨迹进行模式识别和分析,挖掘群体移动轨迹的伴随模式特征,对群体关系发现、特定群体活动监控、城市交通规划等方面具有极大价值。
当前主流的群体移动轨迹伴随模式分析方法是基于轨迹聚类的方法,该方法主要操作包括位置点聚类和相邻簇取交集。CMC(Coherent Moving Cluster)算法为基于轨迹聚类方法中的典型算法,其规定若至少m个移动对象伴随运动持续k个时间片以上则形成轨迹伴随模式。虽然该算法考虑了移动群体活动轨迹的随机性和多样性,能够识别和发现大多数情况下的群体轨迹伴随行为,但是在大数据规模的环境下,该算法中传统聚类和取交集操作执行效率低,扩展性差,对计算和存储资源消耗巨大,难以用于海量移动网信令数据的群体移动轨迹伴随模式的在线分析和实时发现的场景。
发明内容
针对上述现有方法存在的问题,本发明公开了一种大数据环境下的群体轨迹伴随模式在线分析方法和系统。
本发明采用的技术方案如下:
一种大数据环境下的群体轨迹伴随模式在线分析方法,包括以下步骤:
1)设置群体轨迹伴随模式的阈值参数;
2)对接入的群体轨迹流数据进行切片,获得当前时间片的群体位置信息集合;
3)根据当前时间片的群体位置信息集合,构建基于spark的分布式高维索引树KD-Tree;
4)基于KD-Tree进行位置点的密度聚类,形成当前时间片的群体位置聚类快照簇集合Scs;
5)如果当前群体轨迹伴随候选集SetAc为空,则生成新轨迹伴随候选组,将Scs中的位置聚类快照簇放入该新轨迹伴随候选组;
6)如果SetAc不为空,则将Scs中每个位置聚类快照簇与SetAc中的轨迹伴随候选组进行比对,根据步骤1)所述阈值参数进行判断,将Scs中的位置聚类快照簇作为最新时间片快照加入SetAc中存在的伴随候选组,或者生成新轨迹伴随候选组并将Scs中的位置聚类快照簇放入该新轨迹伴随候选组;
7)根据步骤1)所述阈值参数判断当前每个轨迹伴随候选组是否合格,如果合格则输出合格的群体轨迹伴随模式详情,如果不合格则将不合格的轨迹伴随候选组置为闭合状态,并从SetAc中移除。
进一步地,循环执行步骤5)至7),直到结束轨迹伴随模式在线分析。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院信息工程研究所;国家计算机网络与信息安全管理中心,未经中国科学院信息工程研究所;国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910655594.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置