[发明专利]一种基于密度聚类算法的城市交通拥堵状态检测方法在审
申请号: | 201510662173.4 | 申请日: | 2015-10-03 |
公开(公告)号: | CN105261217A | 公开(公告)日: | 2016-01-20 |
发明(设计)人: | 吴悦;武兴业;岳晓冬 | 申请(专利权)人: | 上海大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06F17/30 |
代理公司: | 上海上大专利事务所(普通合伙) 31205 | 代理人: | 陆聪明 |
地址: | 200444*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密度 算法 城市交通 拥堵 状态 检测 方法 | ||
技术领域
本发明涉及空间数据挖掘算法,处理GPS数据检测城市交通拥堵状态,特别是一种基于密度聚类算法的城市交通拥堵状态检测方法,属于计算机技术领域。
背景技术
智能交通系统(IntelligentTransportationSystem,ITS)是解决城市交通问题的重要解决途径之一。大数据时代,智能交通系统已经积累了巨量而复杂的道路交通数据信息,比如车辆的GPS信息,这些交通数据信息为智能交通系统管理和控制交通提供了重要的数据基础。
数据挖掘作为目前最强有力的一种数据分析工具,为道路交通数据的处理提供了新的分析手段,如何设计有效的数据挖掘算法将特定的交通规律挖掘出来是当前智能交通数据挖掘研究的关键。基于密度的聚类算法(DENCLUE,DENsity-basedCLUstEring)算法是Hinneburg等提出的,它是一种泛化的基于核密度估计的聚类算法。其核心思想是每一个空间数据点通过影响函数对空间产生影响,影响值可以叠加,从而在空间形成曲面,曲面的局部极大值点为密度吸引子,该吸引子的吸引域形成一类。将DENCLUE应用于交通数据挖掘,密度吸引子为拥堵区域的中心,吸引域为拥堵区域。
发明内容
本发明的目的是提供一种基于密度聚类算法的城市交通拥堵状态检测方法,通过挖掘车辆GPS大数据得到整个城市的拥堵状态信息。
为达到上述目的,本发明采用的技术方案是:
一种基于密度聚类算法的城市交通拥堵状态检测方法,具体步骤如下:
A.对原始车辆GPS数据进行预处理,得到无噪声或小误差的数据;
B.以限定数量和平均速度作为阈值计算拥堵点,得到候选拥堵点GPS数据;
C.对候选拥堵点GPS数据进行DENCLUE聚类,得到拥堵区域信息;
D.步骤C得到的拥堵区域信息作为城市拥堵状态信息保存到数据库。
上述步骤A中对原始车辆GPS数据进行预处理,得到无噪声或小误差的数据的操作步骤是:
A1)数据清理:GPS设备刚启动或故障原因会造成采集到大量为0的数据;GPS定位的误差会导致在某一时刻定位错误后在接来下的整个时间段采集的数据都是错误的。对于这两种数据需要完全删除;
A2)数据过滤:GPS传感器的噪声会造成采集到的个别数据存在误差,称为异常值(outliers)。对于异常值采用中值滤波器(MedianFilters)进行过滤,即对于检测到的异常值,取其附近n个点的中值替换该异常值。
上述步骤B中限定数量n是确定一个拥堵点所需的GPS数据的个数,与数据量呈正比,但是限定个数越大,造成的误差越大,平均速度是限定数量个GPS数据所经过的距离与时间的商,其特征在于上述步骤B中的以限定数量和平均速度作为阈值计算拥堵点,得到候选拥堵点GPS数据的操作步骤如下:
B1)根据数据集和城市交通状况确定限定数量n和速度阈值vthreshold;
B2)计算包含n个GPS数据的数据子集P{p1,p2…,pn}的平均速度其中d(pi,pi+1)为两个相邻GPS数据之间的距离,t(p1,pn)为两个相邻GPS数据之间的时间间隔;
B3)当数据子集P{p1,p2…,pn}确定一个拥堵点,转到步骤B4);当判断下一个GPS数据pn+1是否存在,如果pn+1存在,数据子集P{p1,p2…,pn}删除p1并添加pn+1,转到步骤B2),如果pn+1不存在,则输出候选拥堵点GPS数据,并转到步骤C;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510662173.4/2.html,转载请声明来源钻瓜专利网。