[发明专利]一种考虑多因素影响的日维度区域交通指数预测方法有效
申请号: | 201710955116.4 | 申请日: | 2017-10-13 |
公开(公告)号: | CN107610469B | 公开(公告)日: | 2021-02-02 |
发明(设计)人: | 翁剑成;邸小建;林鹏飞;王晶晶;付宇;毛力增 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06Q10/04 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 考虑 因素 影响 维度 区域 交通 指数 预测 方法 | ||
1.一种考虑多因素影响的日维度区域交通指数预测方法,其特征在于:该方法具体包括如下步骤:
步骤1,划分并聚合交通区域;
步骤1.1,基于路网结构划分交通小区;
综合考虑用地性质、行政区划、自然地貌、道路网结构因素,将分析区域划分为若干个交通小区;划分交通小区时要考虑到城市内外环区域交通需求差别大,交通需求大的区域划分面积小,而交通需求小的区域面积随之增加;
步骤1.2,基于空间自相关分析的交通小区聚合;
为增强区域路网运行状态评价的针对性和准确性,对琐碎的交通小区合并,将路网运行状态相似的区域采用空间自相关划分方法进行区域聚合;利用局部莫兰指数作为局部空间自相关检验指标,识别区域内运行状态的集聚性质,即根据性质相似性准则实现交通小区的空间聚类;
步骤2,确定区域交通指数相关预测参数;
预测时间间隔和预测周期是交通预测中的重要参数;预测时间间隔代表交通状态变化的数据系列的最小时间单位;区域交通指数预测的目的在于提前预知下一周区域路网整体运行状态的整体趋势,在交通高峰时期准确识别路网运行压力大的区域,以便提前制定相应疏堵措施;因此,应综合考虑预测模型在实际应用中的效率和精度需求,确定区域交通指数的预测时间间隔和预测周期;
步骤3,区域交通指数原始数据预处理;
步骤3.1,计算区域交通指数;
具体计算步骤如下:
S1.计算区域交通初始指数Rm:以不长于15分钟为统计间隔,计算区域m通过各等级路段的自由流速度与实际平均行驶速度的比值;参考路段交通运行等级划分标准,分别统计全路网和区域m路网中各等级道路处于严重拥堵等级的路段里程,以区域m路网中严重拥堵里程占比作权重,按照公式(1)计算得到该区域交通初始指数Rm;
式中,α代表时间段;M代表区域数量;p代表区域m内的路段数量;Lαm代表α时段内区域m内路网中处于严重拥堵等级的路段里程;代表α时段内通过区域m内p个路段的自由流速度;代表α时段内通过区域m内p个路段的实际平均速度;
S2.计算区域交通指数RTI:在对Rm一段时期的数据积累后,按照公式(2)对区域交通指数预指数进行归一化处理,最终得到值域范围属于[0,10]的区域交通指数RTI;
式中,RTI代表区域交通指数;Rm代表区域交通初始指数;Rmin代表历史区域交通指数数据系列中区域交通初始指数的最小值,Rmax代表历史数据系列中区域交通初始指数的最大值;
步骤3.2,原始数据弥补缺失值;
原始数据弥补缺失值的规则如下:
S1.从原始数据中提取出缺失比例小于等于15%的数据系列,对其中的间断部分进行弥补处理;
S2.单个时间点数据缺失的情况下,采用前后相邻两个时间点数据的算数平均值作为恢复数据;
S3.多个连续时间点数据缺失的情况下,提取前i周同期对应历史数据RTIi,wi表示RTIi对应的权重,丢失区域交通指数数据RTId的计算公式为:
式中,0<wi≤1,从时间远近相互关联程度看,各权重之间应满足如下关系:wi+1<wi且i不超过3;
步骤3.3,原始数据剔除异常值;
原始数据剔除异常值的规则如下:
S1.计算数据系列中每个时刻指数数值的前差和后差;
B1_t=RTIt-RTIt-1 (4)
B2_t=RTIt+1-RTIt (5)
式中,B1_t代表某时刻指数数值的前差;B2_t代表某时刻指数数值的后差;RTIt代表当前某一时刻区域交通指数;RTIt-1代表前一时刻区域交通指数;RTIt+1代表后一时刻区域交通指数;
S2.计算每个时刻指数数值的波动指数;
式中,Z代表某时刻指数数值的波动指数;B1_t代表该时刻指数数值的前差;B2_t代表该时刻指数数值的后差;
S3.根据步骤3.3中的S2计算得到的Z值判断该数值是否为奇异值,取15%作为判定界限,若Z>15%,则该数值是奇异值,并做剔除;
步骤3.4,区域交通指数分级处理;
将区域交通指数用以下阈值划分原则将样本分为5类,分别是畅通:0≤RTI<2、基本畅通:2≤RTI<4、轻度拥堵:4≤RTI<6、中度拥堵:6≤RTI<8、严重拥堵:8≤RTI≤10;分类结果用于决策树的拥堵状态等级预测,指数数据用于以上分类完成后利用欧氏距离进行交通指数预测;
步骤3.5,构建训练样本集;
由于区域交通指数的变化受多种因素影响,因此首先需要为训练样本集确定因素属性集;将因素属性集分为区域属性、日期属性、天气属性和事件属性;其中日期属性和天气属性为影响路网运行状态的全局性因素,而区域属性和事件属性是特定区域有可能发生的局部性因素;日期属性因素包括月份、时段、工作日、节假日、星期、学生假期、尾号限行;天气属性因素主要有雨、雪、霾等;事件属性因素包含特殊事件、大型活动、交通管制;对收集的影响因素基础数据进行标准格式化处理,并将影响因素属性集与预处理后的交通指数数据集整合作为训练样本集;
步骤4,构建区域交通指数预测模型
步骤4.1,区域路网运行拥堵状态等级预测;
通过步骤3.5构建的训练样本集来生成区域交通指数决策树,过程主要包括划分选择过程、区域交通指数决策树的更新和区域路网运行状态等级预测过程;
(1)将区域指数样本递归划分进行建树过程
①设结点的训练数据集为D,计算各个因素的基尼指数,包括区域属性、日期属性、天气属性和事件属性;此时,对每一个特征属性A,对其可能取的每个值a,根据样本点对A=a的测试为“是”或“否”将D分割成D1和D2两部分,利用公式(7)和公式(8)计算A=a时的基尼指数;
式中,Gini(D)代表集合D的不确定性;K代表类别总数;k代表类别序号数;pk代表样本点属于第k类的概率;
式中,Gini(D,A)代表经A=a分割后集合D的不确定性;
②在所有可能的特征属性A以及它们所有可能的切分点a中,选择基尼指数最小的特征及其对应的切分点作为最优特征与最优切分点;并从现结点生成两个子结点,将训练数据集依特征分配到两个子结点中去;
③对两个子结点递归地调用①,②,直至满足停止条件;
④生成CART决策树;
⑤设置一个叶子节点需要的最小样本数量,或者树的最大深度,避免过拟合;
(2)区域交通指数决策树的更新
模型的精度受天气预报的准确性影响较大,历史数据的及时更新有助于提升模型精度,因此本方法提出动态更新区域交通指数历史训练库的完善机制;训练库中,一方面为了提高算法运算速度仅选择与预测周期前n个月份的历史数据并始终保留具有特殊属性值的历史数据;另一方面在预测第j个周期前,将j-1周期的真实天气情况进行更新;
(3)输入预测时间段内各个属性值,进行拥堵状态等级预测
收集下周尾号限行、天气情况、大型活动及交通管制各类属性信息,利用生成的区域交通指数决策树进行预测,得到预测时间段内交通运行状态等级的粗分类结果;在划分选择过程中,需要确定划分的标准,即确定属性变量的临界值
步骤4.2,利用平方欧式距离进行区域交通指数预测;
利用平方欧氏距离筛选与当前预测状态最为相似的历史状态下的区域交通指数;定义Y{y1,y2,...,yq}为当前预测状态向量,将粗分类相同的历史状态向量组成集合Xs{XS1,Xs2,...,Xsq};因此,历史状态向量与预测状态向量之间的平方欧氏距离计算公式如下所示:
式中,Cs代表具有相同粗分类结果的第s个历史状态与预测状态的平方欧氏距离;Xsq代表具有相同粗分类结果的数据集X中的第s个历史状态向量中第q个属性的值;yq代表预测状态向量Y中的第q个属性的值;q=1,2,...,Q,q为正整数;
取平方欧式距离小于阈值c的区域交通指数,组成集合V{V1,V2,...VL};阈值c为欧氏距离的第c位百分位数,此时区域交通指数预测值与实际值的平均绝对误差最小;
最终预测的区域交通指数为:
式中,Pf代表预测指数值;L为集合V中的数据数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710955116.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种智能大巴管理系统
- 下一篇:一种交通拥堵评价方法和装置