[发明专利]一种基于轨迹间时空关联性的数据聚类方法有效
申请号: | 201910209981.3 | 申请日: | 2019-03-19 |
公开(公告)号: | CN109948701B | 公开(公告)日: | 2022-08-16 |
发明(设计)人: | 杨雨晴;蔡江辉;杨海峰;张继福;赵旭俊 | 申请(专利权)人: | 太原科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/29 |
代理公司: | 太原高欣科创专利代理事务所(普通合伙) 14109 | 代理人: | 崔雪花;冷锦超 |
地址: | 030024 山*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 轨迹 时空 关联性 数据 方法 | ||
1.一种基于轨迹间时空关联性的数据聚类方法,其特征在于,包括以下步骤:
第一阶段:中心代表点集生成阶段:
对于包含N条轨迹的轨迹数据库,求N的算数平方根的整数并从轨迹数据库中挑选条轨迹作为第一阶段中心代表点集生成的参考轨迹;然后对这条轨迹中的每条轨迹重复执行步骤1和步骤2操作:
步骤1,统计某条轨迹中各轨迹点的半径r邻域内邻居的数量,取邻居数量满足最短停留时间限制的轨迹点和其邻居坐标的均值作为初始中心代表点,从时间和距离约束两方面确定初始中心代表点;
步骤2,计算各邻居与初始中心代表点的距离,将距离的最大值作为该初始中心代表点对应的半径R,
最后,对所有条轨迹所获得的初始中心代表点,根据最短移动时间约束合并初始中心代表点并调整半径AR,直到合并结束时得到中心代表点集;
第二阶段:基于中心代表点集的聚类阶段:
对轨迹数据库中的第条到第N条轨迹聚类时,开始第二阶段的聚类操作:
首先,判断轨迹点与中心代表点集中各代表点的位置关系,删除包含在各中心代表点对应AR范围内的轨迹点,产生新的轨迹;
然后,对新的具有聚类价值的轨迹执行第一阶段中的操作,最后根据聚类结果更新中心点集。
2.根据权利要求1所述的一种基于轨迹间时空关联性的数据聚类方法,其特征在于,包括以下步骤:
第一阶段:中心代表点集生成阶段:
从轨迹数据库中的随机挑选条轨迹,对选中的每条轨迹重复执行S1.1-S1.3中所述的操作;
S1.1,邻居寻找:给定半径r,统计各轨迹点P在半径r范围内的所有邻居的数量;
S1.2,停留时间统计:对于轨迹点P的m个邻居Pn1,Pn2,…,Pni,…,Pnm,计算轨迹点P的所有邻居在其邻域半径r范围内从Pn1所示位置运动到Pnm所示位置经过的时间ST;
S1.3,初始中心候选点计算:选择所有邻居在轨迹点P的半径r范围内的停留时间ST大于最短停留持续时间MinDuration的轨迹点P,将该轨迹点P及其所有邻居的坐标均值记为初始中心候选点的坐标,并将各邻居与中心候选点的最大距离记为该中心候选点对应的半径AR,得到初始中心候选点CP(ALat,ALong,AR),其中ALat和Along分别为该初始中心代表点的纬度和经度坐标,AR为该初始中心代表点所带表的簇的半径;
对所有条轨迹生成的所有初始中心代表点执行S1.4操作;
S1.4,初始中心候选点合并:对所有初始中心代表点,计算各初始中心候选点与其它代表点的距离;如果距离小于最短移动持续时间MinMove,合并中心候选点并调整合并后的中心点对应的半径,合并后的中心点及其半径放入中心点集CR;
第二阶段:基于中心代表点集的聚类阶段:
中心代表点集产生后,对于轨迹数据库中的第条到第N条轨迹聚类时,执行如下的操作步骤:
S2.1,轨迹点与中心代表点集CR的距离计算:对于轨迹中的轨迹点,计算轨迹点与中心代表点集CR中各点的距离;
S2.2,现有聚类簇的发现:将与CR中的点CPi(ALati,ALongi,ARi)的距离小于ARi的轨迹点P,标记到CPi所对应的簇中;
S2.3,未聚类点统计:将轨迹中所有点与CR中的点作距离计算后,统计剩余的未被划分到簇的点的数量Num;
S2.4,新轨迹构造:
S2.3中得到的所述Num小于或等于最小规模的停留中应该包含的轨迹点数目时,第二阶段的聚类过程结束;
S2.3中得到的所述Num大于最小规模的停留中应该包含的轨迹点数目时,删除所有划分到簇的点,产生待聚类的新轨迹;对于新轨迹继续执行第一阶段所述的操作,得到新的中心点集CR。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于太原科技大学,未经太原科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910209981.3/1.html,转载请声明来源钻瓜专利网。