[发明专利]一种时空轨迹数据的频繁模式增量挖掘方法和电子设备有效

专利信息
申请号: 202010183569.1 申请日: 2020-03-16
公开(公告)号: CN111459997B 公开(公告)日: 2023-07-21
发明(设计)人: 钱塘文;徐勇军;吴琳;邵泽志;余泳 申请(专利权)人: 中国科学院计算技术研究所
主分类号: G06F16/2458 分类号: G06F16/2458;G06F16/29;G06F16/906
代理公司: 北京泛华伟业知识产权代理有限公司 11280 代理人: 王勇
地址: 100190 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 时空 轨迹 数据 频繁 模式 增量 挖掘 方法 电子设备
【说明书】:

发明实施例提供了一种时空轨迹数据的频繁模式增量挖掘方法和电子设备,该方法用于对船舶或者航空器的时空轨迹数据进行挖掘,该方法先对轨迹点进行聚类形成多个聚类类簇,每个聚类类簇包括聚类中心和聚类范围,每个聚类中心配有一个身份标识,提取经纬度坐标落在相应聚类类簇的聚类范围的轨迹点并将其用该聚类类簇的聚类中心的身份标识表示,得到用聚类中心的身份标识按序排列表示的经映射后的轨迹,对经映射后的轨迹进行频繁模式挖掘,具有抗干扰性强且便于识别目标的重复轨迹的特定,便于找出目标的轨迹规律,以便为相关用户提供准确的轨迹预测或者服务。

技术领域

本发明涉及信息技术领域,具体来说涉及用于船舶、航空器这类轨迹数据较为离散的目标的时空轨迹数据的数据处理领域,更具体地说,涉及一种时空轨迹数据的频繁模式增量挖掘方法和电子设备。

背景技术

轨迹数据是移动对象在时空中移动点的集合,移动点的数据信息通常包含经纬度、采样时间、对象的信息等数据。时空轨迹数据挖掘是使用人工智能、机器学习、统计学和数据库的交叉方法在相对较大型的数据集中发现模式(Pattern)的计算过程。总体来说,挖掘的目标是从较大数据集中提炼信息,并将其转化成对象的运动模式,从而揭示对象的运动规律。挖掘的结果还可以为后续的轨迹预测、异常检测提供帮助。

轨迹数据挖掘通常通过频繁模式挖掘实现,频繁模式(Frequent Pattern)是数据集中频繁出现的项集、序列或子结构(表示数据的子集)。频繁模式挖掘是数据挖掘研究课题中一个很重要的研究基础,它可以告诉我们在有序数据集中经常一起出现的序列,为可能的决策提供一些支持。

时空轨迹数据的频繁模式,就是移动的物体经常走过的路径。这条路径被称为该物体的频繁模式、经典轨迹或经典轨迹模板。经典的频繁模式挖掘算法有先验关联分析算法(Apriori)、频繁模式增长算法(FP-growth)和前缀扫描算法(PrefixSpan)。下面分别对这三种算法进行简单介绍:

先验关联分析算法(Apriori)使用自顶向下的方法,通过识别数据库中出现次数满足最小支持度阈值的单个频繁项,采用分步扩展的方式将出现足够频繁的单项扩展到更大的项集中。

频繁模式增长算法(FP-growth)为解决先验关联分析算法在生成候选集时频繁遍历数据库中频繁项的I/O瓶颈,设计用于存储频繁模式的树结构(Frequent PatternTree),并在此基础上提出频繁模式挖掘算法,FP-growth算法只需要遍历两次数据库就可以挖掘出频繁模式,相较于Apriori算法拥有极大提升。

前缀扫描算法(PrefixSpan)相较于前两种算法考虑了频繁项出现的先后顺序,并且在挖掘过程中不产生候选序列,所产生的后缀投影数据库(Projected Database)的规模也在不断减小。前缀扫描算法由于不产生候选序列并且数据库I/O开销小,是一种高效的频繁模式挖掘算法。

在挖掘频繁模式时,当轨迹数据中某一轨迹序列出现的次数达到预设次数,则认为这段序列是轨迹的频繁模式,或者称频繁序列。但是,对于海面的船舶或者空中的航空器,难以直接依据现有的频繁模式挖掘方法获得其频繁模式。以船舶为例,由于海面航道是带状的区域,其往复的轨迹之间相比于路面上的行人和交通工具的往复的轨迹之间间距更大且轨迹点更离散。而且,船舶的定位设备存在误差,且其经纬度由28位浮点数进行表示,通过这样的经纬度表示的轨迹点很难出现轨迹点基本重合或者完全重合的情况,会造成轨迹点难以被精准的多次遍历,从而难以准确的找到轨迹中的频繁序列,继而无法为相关用户提供准确的轨迹预测或者服务。

发明内容

因此,本发明的目的在于克服上述现有技术的缺陷,提供一种时空轨迹数据的频繁模式增量挖掘方法和电子设备。

本发明的目的是通过以下技术方案实现的:

根据本发明的第一方面,提供一种时空轨迹数据的频繁模式增量挖掘方法,包括以下步骤:

S1、获取目标的新增的时空轨迹数据并进行预处理;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010183569.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top