[发明专利]一种基于类集成学习的多步交通速度预测方法在审
申请号: | 201910817935.1 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110580548A | 公开(公告)日: | 2019-12-17 |
发明(设计)人: | 沙飞宇;翁仲铭;陶文源 | 申请(专利权)人: | 天津大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06N3/04 |
代理公司: | 12201 天津市北洋有限责任专利代理事务所 | 代理人: | 刘子文 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 预测 神经网络模型 集成阶段 子网络 循环神经网络 交通 集成学习 历史交通 速度预测 损失函数 回归 | ||
本发明公开一种基于类集成学习的复杂交通速度预测方法,该方法基于前一天的历史交通速度来预测未来多步的交通速度,该方法的提升优于目前回归预测中流行的集成方法。该方法由两个的序列到序列的模型(Seq2Seq)和最终生成神经网络模型构成。两个Seq2Seq分别叫做偏高子网络,偏低子网络,它们具有相同的结构,但使用不同的损失函数来完成不同的目标。训练分为生成阶段和集成阶段:生成阶段是对两个Seq2Seq模型的训练,训练好的两个模型可以交通速度进行初步预测;集成阶段,通过训练,最终生成神经网络模型通过循环神经网络结合前两个模型的预测值来做最后的预测,该方法的提升效果与已有方法相比非常显著。
技术领域
本发明方法涉及信息技术领域,特别是涉及计算机领域的神经网络和集成学习,具体为基于类集成学习的多步交通速度预测方法。
背景技术
未来交通预测是智慧交通系统重要的部分,对于交通网络规划、行驶路线规划和拥堵避免等具有重要意义。然而交通系统是一个复杂的系统,每条道路的交通速度受很多因素的影响,例如突然事件,天气情况,节假日等。这种非线性和高度的随机性,增加了准确预测未来交通情况的困难。
近几年,许多研究对交通速度预测应用了很多当时流行的机器学习方法。例如,神经网络和支持向量机。通过训练来找到历史交通速度和未来交通速度一种非线性关系。神经网络和支持向量机都是通过一次输入历史的交通速度序列,然后一次预测出未来的交通速度序列。研究表明这是不合理的,神经网络和支持向量机缺少对序列信息的学习。研究发现使用循环神经网络(RNN)可以更好的学习这种时间序列的非线性关系。循环神经网络是按照序列的顺序依次接收交通速度,然后依次预测未来的交通速度。交通速度预测与语言模型具有很多相似性,都是序列到序列的预测,所以使用RNN大多都是采用语言模型中的序列到序列的模型。序列到序列的模型由编码器和解码器组成,编码器负责接收输入的序列分析其特征,然后传递给解码器,解码器根据特征进行序列的预测。传统的循环神经元对于长序列的学习能力不足,所以大多采用长短期记忆单元(LSTM)构造循环神经网络。门控循环单元(GRU)是LSTM的变体,将LSTM门控单元从三个减少到两个,同时研究发现GRU和LSTM对于很多问题的性能都差不多,所以LSTM和GRU都被用来预测交通速度,取得了更好的表现。2015年,为了帮助机器翻译记住较长的源句,应用于序列到序列模型的注意力机制被提出去。很多研究把注意力机制应用到了交通速度预测,取得了超越之前的结果。然而,这些方法的迁移并没有考虑交通序列的预测与语言模型的不同,对于复杂的交通情况,预测能力仍然不足。
集成学习有助于改善单个模型的性能。集成学习是对多个单一的基模型预测结果的结合。对于回归问题,集成学习最后的预测值通常取每个模型输出的平均值,也可以通过加权求和或者SVR集成得到。但目前大多的集成学习对于回归问题组合方式单一,研究较少,而且往往只关注对下一个时刻的预测。同时为了增加模型见得相异性,实际中需要设计多个不同基模型,实现困难。
发明内容
本发明的目的是为了克服现有技术中的不足,针对复杂的交通情况,提供一种基于类集成学习的多步交通速度预测方法,该方法由两个的序列到序列的模型(Seq2Seq)和最终生成神经网络模型构成。两个Seq2Seq分别叫做偏高子网络,偏低子网络,它们具有相同的结构,但使用不同的损失函数。偏高子网络和偏低子网络都为256个长短期记忆单元(LSTM)构成的序列到序列的模型。为了在减轻网络的复杂度加快训练速度,同时不损失精度,最终生成神经网络模型的编码器由64个门控单元(GRU)构成,解码器由64个传统的循环神经单元构成。偏高子网络更关注预测值比真实值小的情况,即增加预测值比真实值小时的损失权重,所以最终预测的序列整体会比真实值大。偏低子网络正好相反。最终生成神经网络模型的编码器进一步分析交通序列的信息,然后其解码器根据从解码器获得的信息和两个Seq2Seq的预测值来生成最后的预测值。
本发明的目的是通过以下技术方案实现的:
一种基于类集成学习的多步交通速度预测方法,包括生成步骤和集成步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910817935.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理