[发明专利]一种基于多级索引结构的大规模轨迹数据相似性查询方法在审
申请号: | 202110340933.5 | 申请日: | 2021-03-30 |
公开(公告)号: | CN113051359A | 公开(公告)日: | 2021-06-29 |
发明(设计)人: | 齐恒;王维泽;申彦明 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/29 | 分类号: | G06F16/29;G06F16/28;G06F16/22;G06K9/62 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 刘秋彤;梅洪玉 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多级 索引 结构 大规模 轨迹 数据 相似性 查询 方法 | ||
1.一种基于多级索引结构的大规模轨迹数据相似性查询方法,其特征在于,步骤如下:
步骤1:对包含GPS信息的大规模轨迹数据集进行轨迹数据预处理,对于预处理操作后得到的轨迹数据集利用地理空间信息进行网格划分,划分成大小相同的空间网格子集,每个空间网格子集都对应存储一块空间,同时对每个空间网格子集加以编号,生成网格索引;
将每一条轨迹经过的空间网格子集标识为1,没有经过的空间网格子集标识为0,依次按照对空间网格子集的编号顺序来标记,则每条轨迹能够通过一串具有二进制信息的数字签名来记录轨迹所经过的空间网格子集;
步骤2:对于每个空间网格子集,使用特征轨迹生成器来计算出空间网格子集中存储的轨迹集中每条轨迹的特征轨迹,利用特征轨迹的起点和终点进行聚类分区,得到基于轨迹起点和终点的起止索引,在每一个空间网格子集都会建立一个起止索引,再使用特征轨迹的3种特征轨迹表示点进行聚类操作来建立特征点索引,建立起止索引-特征点索引的二级索引结构;这样基于网格索引-起止索引-特征点索引的多级索引结构建立完成;
步骤3:在轨迹相似性查询阶段中,输入查询轨迹,利用网格索引对查询轨迹的空间信息计算出相应的轨迹网格签名,通过轨迹网格签名确定查询轨迹所在的空间网格子集,实现对轨迹数据集进行粗粒度的初步筛选;
步骤4:对于网格索引确定的空间网格子集,利用空间网格子集对应的起止索引,与查询轨迹的起点和终点进行匹配,返回备选轨迹所在的分区,再通过对分区中的特征点索引的3种特征轨迹表示点与查询轨迹进行距离计算,大于给定阈值的特征轨迹表示点则直接筛选掉,从而达到对轨迹数据更加细粒度筛选的目的;
步骤5:通过网格索引-起止索引-特征点索引的多级索引结构进行粗粒度-细粒度两次筛选所得到的备选特征轨迹,返回备选特征轨迹对应的完整轨迹,并与查询轨迹进行轨迹相似性计算来验证结果,返回符合查询条件的轨迹数据作为轨迹相似性查询的最终结果。
2.根据权利要求1所述的一种基于多级索引结构的大规模轨迹数据相似性查询方法,其特征在于,所述特征轨迹的获得方式具体为:
步骤(1):对于空间网格子集中的每条轨迹,通过特征轨迹生成器取出每条轨迹的起点和终点,并赋予权值;
步骤(2):对于空间网格子集中的每条轨迹,除去起点和终点后对剩余的轨迹点使用特征轨迹生成器计算各个轨迹点之间的距离,将每两个轨迹点间的距离作为权值赋予给轨迹点对中的排序靠后的轨迹点,并根据权值进行排序,取出权值最大的轨迹点作为特征轨迹表示点之一;
步骤(3):对于空间网格子集中的轨迹数据,对除去起点和终点的每条轨迹中剩余的轨迹点使用特征轨迹生成器来计算各个轨迹点距离轨迹的起点和终点的距离,取每个轨迹点与轨迹的起点、每个轨迹点与轨迹的终点这两个距离中最大值作为权值赋予给每个轨迹点,并根据权值进行排序,取出权值最大的轨迹点作为特征轨迹表示点之一;
步骤(4):对于空间网格子集中的轨迹数据,对除去起点和终点的每条轨迹中剩余的轨迹点使用特征轨迹生成器来计算每条轨迹中的拐点,将轨迹中的每个拐点的改变角度作为权值,并根据权值进行排序,取出所有权值最大的拐点作为特征轨迹表示点之一;
其中轨迹中轨迹点拐度的计算加权公式如下:
其中:
A、B、C为一条轨迹中连续的三个轨迹点;
BAngle为轨迹点B计算得到的轨迹点的拐度;
A.x为轨迹点A的GPS横坐标;B.x为轨迹点B的GPS横坐标;C.x为轨迹点C的GPS横坐标;
A.y为轨迹点A的GPS纵坐标;B.y为轨迹点B的GPS纵坐标;C.y为轨迹点C的GPS纵坐标;
步骤(5):特征轨迹生成器将空间网格子集中每条轨迹的起点、终点、步骤2-3得到的特征轨迹表示点组合在一起生成特征轨迹。
3.根据权利要求1或2所述的一种基于多级索引结构的大规模轨迹数据相似性查询方法,其特征在于,所述的起止索引和特征点索引的建立方法具体为:
步骤A:对于空间网格子集中的每条轨迹,使用特征轨迹生成器来计算得出相应的特征轨迹,并取出特征轨迹的起点和终点;
步骤B:对空间网格子集中的每条轨迹中的起点和终点进行聚类分区的操作,使具有相同起点和终点的轨迹存储分布在同一个分区中,并对所有分区的起点和终点建立空间R树作为轨迹数据的起止索引;
步骤C:对于每个空间网格子集都具有对应的起止索引,通过特征轨迹生成器来取出每个分区中各个轨迹的3种特征轨迹表示点,对所有轨迹的3种特征轨迹表示点建立索引作为特征轨迹点索引,形成基于特征轨迹的起止索引-特征点索引二级索引结构。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110340933.5/1.html,转载请声明来源钻瓜专利网。