[发明专利]一种考虑时空特征的网联车辆轨迹聚类方法在审
申请号: | 202011585050.2 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112733890A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 于海洋;方婧;任毅龙 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29 |
代理公司: | 北京佳信天和知识产权代理事务所(普通合伙) 11939 | 代理人: | 张宏伟 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 时空 特征 车辆 轨迹 方法 | ||
本专利公开了一种考虑时空特征的网联车辆轨迹聚类方法,包括步骤一、对轨迹区域内的交叉路口进行编号,根据轨迹通过的路段,将轨迹转化为其经过的交叉口的编号序列;步骤二、计算轨迹间的空间距离、时间距离以及编辑距离;其中所述编辑距离为组成估计的字符串之间的编辑距离;步骤三、根据步骤二计算出的空间距离、时间距离以及编辑距离数据,采用信息量权数法对三个距离的权重系数进行计算,进而求出考虑了时空差异性的综合距离;步骤四、基于聚类对象局部密度和距离对轨迹进行聚类。在考虑轨迹差异性时引入编辑距离的概念,多维度的评估轨迹之间的差异性;且采用一种新型的聚类方法,使得聚类结果更合理。
技术领域
本发明涉及轨迹聚类技术,具体涉及一种考虑时空特征的网联车辆轨迹聚类方法。
背景技术
近年来,随着通信技术的发展以及网联车辆的增多,越来越多网联车辆的GPS轨迹数据被采集或记录在云端。轨迹数据一般是由多条带有时间戳的位置信息构成的带有时序性的序列,描述的是车辆的移动行为,通过对车辆轨迹数据进行分析,可以挖掘大量的出行信息。
聚类是通过分析数据对象之间的相似性,并把相似性高的数据划分成同一类,通过对车辆的轨迹进行聚类可以获取很多信息,如:通过聚类结果可以分析居民日常出行的热点路径,支撑路网重点通道和路段的判断识别,辅助公交路线的修改和设立等多种有关城市交通规划管理的方面。
传统的聚类算法如Kmeans是以距离作为对象的相似性度量标准,这也是大多数聚类算法所采纳的,而且一般使用欧氏距离做为距离的计算方法,但是仅仅以欧氏距离衡量轨迹之间的差异性并没有考虑轨迹之间的时间特征,因此并不能取得很好的聚类效果。
发明内容
本发明的目的在于提供一种考虑时空特征的网联车辆轨迹聚类方法,以充分考虑影响聚类的各种因素,提高聚类结果的准确性。
为了解决上述问题,本发明提供的技术方案包括:
1.一种考虑时空特征的网联车辆轨迹聚类方法,其特征在于,所述方法包括如下步骤:
步骤一、对轨迹区域内的交叉路口进行编号,根据轨迹通过的路段,将轨迹转化为其经过的交叉口的编号序列;
步骤二、计算轨迹间的空间距离、时间距离以及编辑距离;其中所述编辑距离为组成估计的字符串之间的编辑距离;
步骤三、根据步骤二计算出的空间距离、时间距离以及编辑距离数据,采用信息量权数法对三个距离的权重系数进行计算,进而求出考虑了时空差异性的综合距离;
步骤四、基于聚类对象局部密度和距离对轨迹进行聚类。首先对轨迹数据及其部分特征进行描述与定义。其包括:计算轨迹对象的局部密度ρqi;计算轨迹对象之间的距离δqi;计算轨迹对象的分类标签nqi;根据轨迹对象的局部密度和距离判断聚类中心;将其余轨迹对象根据其分类标签分类到聚类中心的簇当中。
优选地,将每条轨迹作为一个对象,
计算轨迹对象的局部密度其中函数参数Dij为轨迹ti和轨迹tj之间的综合距离;参数Dc为截断距离,Dc>0;m个轨迹对象之间的综合距离一共有个,对其进行升序排列,设得到的序列为D1≤D2≤...≤Dnum,取Dc=Df(num*t),其中f(num*t)表示对num*t进行四舍五入后得到的整数,t取0.02;
轨迹对象之间的距离其中,限定表示的一个降序排列下标序,满足为轨迹和轨迹间的综合距离;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011585050.2/2.html,转载请声明来源钻瓜专利网。