[发明专利]一种基于海量交通流数据的城市交通热点区域划分方法有效
申请号: | 201510014926.0 | 申请日: | 2015-01-11 |
公开(公告)号: | CN104574965B | 公开(公告)日: | 2017-01-04 |
发明(设计)人: | 俞东进;王瑞婷;李万清 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06F19/00 |
代理公司: | 浙江杭州金通专利事务所有限公司33100 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 海量 通流 数据 城市交通 热点 区域 划分 方法 | ||
技术领域
本发明属于数据挖掘技术领域,具体涉及到一种基于海量交通流数据的城市交通热点区域划分方法。
背景技术
随着经济的持续高速发展,机动车保有量迅猛增加给城市带来的交通问题日益突显,交通拥挤、车流不畅,极大地影响了人们出行速度,进而降低了生产和工作效率。目前,城市交通监控系统相对完善,各干道及路口都设有卡口实时采集过车数据。通过分析城市交通监控系统中所采集的过车数据,从而发现车辆的行车路线,利用行车路线可以挖掘车辆间隐藏的频繁同时出现的卡口。以该隐藏信息为划分城市交通热点区域的依据,并计算其交通繁忙指数,可以为交通管理部门提供制定交通管理方案的参考、为道路规划部门提供制定道路规划的参考等,最终为解决交通问题提供帮助。
研究车辆的行车路线,往往可以发现许多车辆有类似的行车区域。例如,在浙江省杭州市工作日早、晚高峰,会有大量的车行驶于市区与滨江区连通干道,跨江大桥必定是这些车辆群体所经过的城市交通热点区域;周末,出行的城市交通热点区域必定有通往西湖景区的各大干道。上述城市交通热点区域的主要特征可以归纳为:一群不同的车辆在相近的时间点经过一系列相同的卡口,而区域就由这些卡口组成,经过这些卡口的车辆总数记为该城市交通热点区域的交通繁忙指数。发现城市不同时间段内的城市交通热点区域划分并计算其交通繁忙指数,可以为交通管理部门提供有效的缓解拥堵手段提供帮助。
发明内容
本发明针对现有技术的不足,提供了一种基于海量交通流数据的城市区域划分方法。
本发明技术方案的主要构思是:利用自然语言处理中从单词和文档组成的语料库里提取主题的思想解决城市交通热点区域划分的问题;将一段时间内,交通监控系统(监控、采集、存放城市主要干道及路口实时交通情况的系统)中所有过车数据组成语料库,其中每辆车在各个卡口出现的记录形成该车所对应的一篇文档,而这些卡口编号作为文档中的单词,并提取其中隐含的经常同时出现的卡口编号集合作为语料库的主题对应城市交通热点区域;
本发明方法包括以下步骤:
步骤(1).将各个外场设备卡口获得的过车信息数据发送至中央数据库,过车信息数据包括车牌号、过车时间、过车方向和过车卡口编号;
步骤(2).根据LDA(Latent Dirichlet Allocation)主题提取模型,获取某设定时间段内中央数据库中所有卡口过车信息数据,将其转化为所需的语料库形式并对其建模,具体为:
获取城市所有卡口编号作为单词组成词典,从中央数据库中取某设定时间段内的所有卡口过车信息数据,再从其中获取每辆车在该时间段内由经过的卡口编号组成的过车记录文档,然后将所有车辆的过车记录文档合并形成语料库文档,统计该语料库文档中每辆车在各个卡口的出现概率,将其保存在一个车牌号-卡口的概率矩阵中,该矩阵的每个单元表示某辆车在某个卡口出现的概率;
设共有N个卡口,即N个单词,记为:wordj,j=0,1,...,(N-1),某设定时间段内出现的车有M辆,即M篇文档,记为:doci,i=0,1,...,(M-1),由所有过车信息数据可以得到语料库文档,该语料库文档的每一行记录一辆车在该时间段内经过的卡口编号序列,统计语料库文档中每篇文档所对应词典中各个单词出现的次数及每篇文档的单词总数,分别记为:ai,j、dwSumi,并通过计算得到文档-单词概率矩阵,记为:Mdoc-word,该矩阵共M行、N列,矩阵的第i行第j列对应第i辆车在该时间段内经过第j个卡口的概率,计算方法为:
对语料库文档进行LDA主题建模,假设城市交通热点区域个数为K,即K个主题,记为:topick,k=0,1,...,(K-1),根据LDA模型,假设语料库文档中文档和主题分别满足以α和β为先验参数的狄利克雷分布,那么语料库中每篇文档和每个主题的生成过程分别满足和多项分布,则语料库中文档-主题的分布和主题-单词的分布可分别表示为doc-topic概率矩阵、topic-word概率矩阵,记为:Mdoc-topic、Mtopic-word,最终的Mtopic-word即为LDA的模型结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510014926.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置