[发明专利]一种基于轨迹压缩和聚类的轨迹相似度分析方法在审
申请号: | 202210552364.5 | 申请日: | 2022-05-20 |
公开(公告)号: | CN114970707A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 徐文波;曹坤;孙加成;杨瑞;王思野;王佳佳 | 申请(专利权)人: | 北京邮电大学;龙文华丰(北京)科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29;G06F16/215 |
代理公司: | 北京太兆天元知识产权代理有限责任公司 11108 | 代理人: | 杨翼林 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轨迹 压缩 相似 分析 方法 | ||
本发明公开了一种基于轨迹压缩和聚类的轨迹相似度分析方法。首先,对N条基准轨迹进行轨迹压缩,在一定误差范围内,去除一些轨迹数据,便于后续的处理和分析。其次,通过截取公共轨迹以及角度预判断的方式,减少参与计算的轨迹段范围,对基准轨迹数据离线聚类。其中,在计算相似度矩阵时,在误差范围内,每两条轨迹的相似度只需计算一次以降低复杂度。最后,找出每一簇的代表轨迹,计算待匹配轨迹和每一簇代表轨迹的相似度,判断其是否存在于基准轨迹数据库中;如果存在,则计算该轨迹与对应簇的各基准轨迹的轨迹相似度,从而确定实际轨迹与哪些基准轨迹相似,并得到相似度结果。
技术领域
本发明涉及轨迹数据处理技术领域,尤其涉及一种基于轨迹压缩和聚类的轨迹相似度分析方法。
背景技术
随着通信设备的覆盖率与日俱增,基站可以接收各类移动终端所持设备的无线电波,从而转化为移动数据。通过移动数据,研究人员可获取特定移动终端在不同时段的大致位置,产生相应的时间序列数据,即轨迹数据。在特定的通信场景下,需要针对性地分析某一类终端的轨迹相似性,在大规模的基准轨迹数据库中进行轨迹匹配,判断捕获的轨迹数据是否存在于数据库中。
然而,直接使用原始轨迹数据是不合理的。一方面,基准轨迹数据库的轨迹采集时间密集,轨迹数据量较大。另一方面,基准数据库中存在大量的数据冗余,给轨迹相似度计算带来巨大的时间成本和空间成本。此外,由于基准数据库的轨迹数量较多,对采集的实际轨迹进行在线一一匹配的计算量无法满足工程应用对实时性的需求。
发明内容
为解决现有技术存在的局限和缺陷,本发明提供一种基于轨迹压缩和聚类的轨迹相似度分析方法,包括:
使用OPW-TR算法对N条基准轨迹进行轨迹压缩,在预设的误差范围内,去除对应的轨迹数据;
通过截取公共轨迹和角度预判断的方式,减少参与计算的轨迹段范围;
使用DBSCAN算法对基准轨迹数据离线聚类,在预设的误差范围内,计算相似度矩阵时每两条轨迹的相似度只需计算一次以降低复杂度,相似度计算采用LCSS算法;
记录聚类结果,获得每一簇的代表轨迹,使用LCSS算法计算待匹配轨迹与每一簇的代表轨迹的相似度;
判断所述待匹配轨迹与每一簇的代表轨迹的相似度是否大于预设的相似度阈值;
若判断结果为所述待匹配轨迹与其中一簇的代表轨迹的相似度大于预设的相似度阈值,且相似度最高,使用LCSS算法计算所述待匹配轨迹与对应簇的各个基准轨迹的轨迹相似度;
判断所述待匹配轨迹与对应簇的各个基准轨迹的轨迹相似度是否大于预设的轨迹相似度阈值;
若判断结果为所述待匹配轨迹与对应簇的其中一些基准轨迹的轨迹相似度大于预设的轨迹相似度阈值,确定所述待匹配轨迹与哪些基准轨迹相似,并且输出相似度结果。
可选的,所述相似度的计算公式如下:
S=相似的轨迹段/min(m,n)
其中,S为相似度,所述相似度矩阵的维度为N×N,N为轨迹数,L1和L2为其中两条轨迹,轨迹L1分为m段,轨迹L1有m+1个点,轨迹L2分为n段,轨迹L2有n+1个点。
可选的,轨迹段相似的条件包括:所述轨迹段的距离大于预设的距离阈值,所述距离阈值由水平阈值、垂直阈值、角度阈值组成,所述水平阈值、所述垂直阈值、所述角度阈值的权重之和为1;
两条轨迹的垂直距离的计算公式如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学;龙文华丰(北京)科技有限公司,未经北京邮电大学;龙文华丰(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210552364.5/2.html,转载请声明来源钻瓜专利网。