[发明专利]一种时空轨迹数据的频繁模式增量挖掘方法和电子设备有效
申请号: | 202010183569.1 | 申请日: | 2020-03-16 |
公开(公告)号: | CN111459997B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 钱塘文;徐勇军;吴琳;邵泽志;余泳 | 申请(专利权)人: | 中国科学院计算技术研究所 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06F16/29;G06F16/906 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇 |
地址: | 100190 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时空 轨迹 数据 频繁 模式 增量 挖掘 方法 电子设备 | ||
本发明实施例提供了一种时空轨迹数据的频繁模式增量挖掘方法和电子设备,该方法用于对船舶或者航空器的时空轨迹数据进行挖掘,该方法先对轨迹点进行聚类形成多个聚类类簇,每个聚类类簇包括聚类中心和聚类范围,每个聚类中心配有一个身份标识,提取经纬度坐标落在相应聚类类簇的聚类范围的轨迹点并将其用该聚类类簇的聚类中心的身份标识表示,得到用聚类中心的身份标识按序排列表示的经映射后的轨迹,对经映射后的轨迹进行频繁模式挖掘,具有抗干扰性强且便于识别目标的重复轨迹的特定,便于找出目标的轨迹规律,以便为相关用户提供准确的轨迹预测或者服务。
技术领域
本发明涉及信息技术领域,具体来说涉及用于船舶、航空器这类轨迹数据较为离散的目标的时空轨迹数据的数据处理领域,更具体地说,涉及一种时空轨迹数据的频繁模式增量挖掘方法和电子设备。
背景技术
轨迹数据是移动对象在时空中移动点的集合,移动点的数据信息通常包含经纬度、采样时间、对象的信息等数据。时空轨迹数据挖掘是使用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式(Pattern)的计算过程。总体来说,挖掘的目标是从较大数据集中提炼信息,并将其转化成对象的运动模式,从而揭示对象的运动规律。挖掘的结果还可以为后续的轨迹预测、异常检测提供帮助。
轨迹数据挖掘通常通过频繁模式挖掘实现,频繁模式(Frequent Pattern)是数据集中频繁出现的项集、序列或子结构(表示数据的子集)。频繁模式挖掘是数据挖掘研究课题中一个很重要的研究基础,它可以告诉我们在有序数据集中经常一起出现的序列,为可能的决策提供一些支持。
时空轨迹数据的频繁模式,就是移动的物体经常走过的路径。这条路径被称为该物体的频繁模式、经典轨迹或经典轨迹模板。经典的频繁模式挖掘算法有先验关联分析算法(Apriori)、频繁模式增长算法(FP-growth)和前缀扫描算法(PrefixSpan)。下面分别对这三种算法进行简单介绍:
先验关联分析算法(Apriori)使用自顶向下的方法,通过识别数据库中出现次数满足最小支持度阈值的单个频繁项,采用分步扩展的方式将出现足够频繁的单项扩展到更大的项集中。
频繁模式增长算法(FP-growth)为解决先验关联分析算法在生成候选集时频繁遍历数据库中频繁项的I/O瓶颈,设计用于存储频繁模式的树结构(Frequent PatternTree),并在此基础上提出频繁模式挖掘算法,FP-growth算法只需要遍历两次数据库就可以挖掘出频繁模式,相较于Apriori算法拥有极大提升。
前缀扫描算法(PrefixSpan)相较于前两种算法考虑了频繁项出现的先后顺序,并且在挖掘过程中不产生候选序列,所产生的后缀投影数据库(Projected Database)的规模也在不断减小。前缀扫描算法由于不产生候选序列并且数据库I/O开销小,是一种高效的频繁模式挖掘算法。
在挖掘频繁模式时,当轨迹数据中某一轨迹序列出现的次数达到预设次数,则认为这段序列是轨迹的频繁模式,或者称频繁序列。但是,对于海面的船舶或者空中的航空器,难以直接依据现有的频繁模式挖掘方法获得其频繁模式。以船舶为例,由于海面航道是带状的区域,其往复的轨迹之间相比于路面上的行人和交通工具的往复的轨迹之间间距更大且轨迹点更离散。而且,船舶的定位设备存在误差,且其经纬度由28位浮点数进行表示,通过这样的经纬度表示的轨迹点很难出现轨迹点基本重合或者完全重合的情况,会造成轨迹点难以被精准的多次遍历,从而难以准确的找到轨迹中的频繁序列,继而无法为相关用户提供准确的轨迹预测或者服务。
发明内容
因此,本发明的目的在于克服上述现有技术的缺陷,提供一种时空轨迹数据的频繁模式增量挖掘方法和电子设备。
本发明的目的是通过以下技术方案实现的:
根据本发明的第一方面,提供一种时空轨迹数据的频繁模式增量挖掘方法,包括以下步骤:
S1、获取目标的新增的时空轨迹数据并进行预处理;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010183569.1/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置