[发明专利]一种基于混合特征挖掘的交通流量预测方法有效
申请号: | 202010603955.1 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111508240B | 公开(公告)日: | 2020-09-22 |
发明(设计)人: | 黄倩;季玮;宋晓峰;李道勋;季欣凯;吴戡 | 申请(专利权)人: | 之江实验室 |
主分类号: | G08G1/065 | 分类号: | G08G1/065;G06Q50/30;G06Q10/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 刘静 |
地址: | 310023 浙江省杭州市余*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 混合 特征 挖掘 交通 流量 预测 方法 | ||
1.一种基于混合特征挖掘的交通流量预测方法,其特征在于,该方法包括以下步骤:
步骤(1):构建多维初始化原始数据;
初始化原始数据由多维数据组成,包括交通流量数据和混合特征数据,所述交通流量数据为车流量或车速数据;所述混合特征数据包括时间数据和交通态势数据;多维数据中,假设某个当前时间点是T,预测T+
1.1)交通流量数据为T时刻之前的Y个小时的历史数据和相应的预测T+
1.2)所述混合特征数据,其中时间数据与要预测的未来交通流量的时间点T+
步骤(2):解析步骤(1)中得到的混合特征数据,并将解析后的特征数据向量化;具体步骤如下:
2.1)对混合特征数据中的时间数据进行分解;将时间数据分解为离散值数据特征;
2.2)将交通态势特征数据分解为离散值数据特征和拥挤持续时长的连续值数据特征,所述离散值数据特征包括是否发生交通事故、事故等级和拥堵程度;
2.3)将分解后的数据特征向量化,对连续值数据特征进行标准化,均值为0,方差为1,离散值数据特征独热化one-hot编码,此处特征向量化能够提升特征挖掘效率;
步骤(3):计算分解并向量化后的特征数据的重要性,将重要性小于设定阈值的特征去除,具体步骤如下:
3.1)采用简单纯随机抽样方法,将所有数据作为总样本,从M个总样本中不重复抽样出N个样本,使得抽样样本随机包含分解并向量化后的特征数据;N值范围为:
3.2)使用抽样出的N个样本数据构建最大深度为D的提升树tree booster,深度D根据样本数据量大小和各个特征数据的取值特点进行调整;
3.3)分别计算每一个特征数据在提升树中的重要性;使用重要性指标total_gain,即根据某特征数据在每次分裂节点带来的总增益,计算该特征数据的重要性得分;
3.4)将数据特征按步骤3.3)中计算得到的重要性得分排序,去除重要性得分小于阈值的特征数据,设置方法如下:
设重要性得分平均数为μ,重要性得分方差为,
则设置为,
其中系数表示的含义是,当系数取值为时,重要性得分取值落在以下区间的概率为:
式中,为重要性得分最大值;即有的重要性得分大于等于的数据特征被保留,的重要性得分小于的数据特征被剔除;系数及相应的应根据实际应用中重要性取值分布情况进行调整;
步骤(4):对保留下来的特征数据,计算两两特征之间的最大互信息系数,根据最大互信息系数取值分布情况,按实际需求选取阈值;将最大互信息系数大于阈值的两个特征,删除重要性得分小的那个特征,即去除重复冗余特征;
步骤(5):重新构建数据;将步骤(4)最终保留下来的混合特征数据和交通流量数据组合成数据集;
步骤(6):构建基于GRU的交通流量预测模型,将步骤(5)构建的数据集中的特征数据和历史交通流量数据作为模型的输入,模型的输出为相应的要预测的交通流量数据;具体步骤如下:
6.1)模型的输入维度即为特征数据和历史流量数据的综合维度H;
6.2)模型的输出维度即为要预测的K个时间点的流量数据的维度K;
6.3)构建基于GRU时序预测模型,模型层数为N_layers,隐藏层个数为N_hidden_units,输入维度为H,输出维度为K;
6.4)设计模型损失函数为L2损失函数,优化器为Adam优化器;
6.5)训练预测模型使模型损失函数最小,反复迭代直至模型完全收敛,同时根据测试集测试性能优化模型超参数;
6.6)使用训练好的模型对实际道路未来K个时间点的交通流量进行预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于之江实验室,未经之江实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010603955.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种同态加密方法及装置
- 下一篇:一种端子与磁芯组装机