[发明专利]一种基于多级索引结构的大规模轨迹数据相似性查询方法在审
申请号: | 202110340933.5 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113051359A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 齐恒;王维泽;申彦明 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/28;G06F16/22;G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 刘秋彤;梅洪玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多级 索引 结构 大规模 轨迹 数据 相似性 查询 方法 | ||
一种基于多级索引结构的大规模轨迹数据相似性查询方法,属于城市交通大数据处理与应用的领域。本发明分为索引建立阶段和轨迹相似性查询阶段,在索引建立阶段,首先对原始轨迹数据进行数据预处理,并基于空间网格索引思想对预处理后得到的轨迹数据建立网格索引,通过网格索引对轨迹数据集进行网格划分。其次,对于每条轨迹都通过构建特征轨迹来表示该轨迹的特征信息,对空间网格中每条轨迹的起点和终点建立起止索引,再根据每条轨迹的特征轨迹点建立特征点索引,从而将具有轨迹特征信息的轨迹点所组成的特征轨迹应用到多级索引结构上。最后,建立起网格索引‑起止索引‑特征点索引组成的多级索引结构。
技术领域
本发明属于城市交通大数据处理与应用的领域,具体涉及一种基于多级索引结构的大规模轨迹数据相似性查询方法。
背景技术
近年来,随着卫星定位技术、手机、GPS等移动设备的发展,每天都会产生大量的轨迹数据。轨迹数据里蕴含着巨大的价值,通过对轨迹数据进行挖掘,可以为日常生活中不同类型的应用所服务。由于轨迹存在于我们生活中的各个角落,丰富的轨迹数据资源也带来了对于轨迹数据研究的巨大需求。轨迹数据是属于时空数据的一种,包含了空间信息和时间属性,轨迹的空间位置同时会随着时间而动态地发生变化。轨迹数据具有非结构化、时效性强、规模大的特点。如何高效地对轨迹数据进行处理与分析是当今社会上与大数据技术相关的热点问题。
轨迹的查询操作是轨迹数据管理的关键技术之一,在近年来已逐渐趋于成熟。由于用户需求多种多样,轨迹数据分析与挖掘的应用也是各有不同,针对不同的应用场景也就需要不同类型的查询操作。按照查询类型的不同,轨迹查询可以分为范围查询、K近邻查询、相似性查询等查询操作。
轨迹的相似性查询是指给定查询轨迹,从数据集中查找与给定轨迹满足相似条件的轨迹,主要分为基于阈值的相似性查询和Top-k相似性查询功能。基于阈值的相似性查询操作就是指当用户给定一个相似性阈值,需要在一个轨迹数据集中查找出满足用户要求相似性的轨迹集,并返回给用户;Top-k相似性查询即是对于返回的轨迹集,根据相似度进行排序,选出前k条与查询轨迹最相似的轨迹。近年来对于轨迹相似性查询的研究成为了一个热点问题,相似性轨迹数据可以返回与输入轨迹相似的候选轨迹,从而对频繁轨迹、相似轨迹进行分析,便于挖掘轨迹大数据中潜在的信息与模式。比如在人类移动周期模式挖掘中,采用相似轨迹查询方法可以发现不同时间间隔中相似的人类移动行为,有助于研究城市人群的通勤规律。在位置预测中,已知当前移动对象的位置和历史轨迹,通过轨迹相似性查询,从相似的历史轨迹中发现移动行为的规律和模式,用于预测未来某个时间点的位置,在个性化推荐、交通管理以及天气预报等方面应用广泛。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110340933.5/2.html,转载请声明来源钻瓜专利网。