[发明专利]一种基于时空集成学习的交通数据缺失值插补方法在审
申请号: | 202111358967.3 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114004421A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 于明霞;秦拯;肖竹;张吉昕;梁晋文 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 长沙麓创时代专利代理事务所(普通合伙) 43249 | 代理人: | 贾庆 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 集成 学习 交通 数据 缺失 值插补 方法 | ||
本发明涉及一种基于时空集成学习的交通数据缺失值插补方法。其发明内容主要包括:(1)基于梯度增强长短时记忆网络的交通数据时间维集成插补方法;(2)基于AdaBoost回归算法的交通数据空间维集成插补方法。通过对交通数据进行时间特征表征和空间特征表征,分别构建了交通数据时间维集成插补模型和空间维集成插补模型来实现对不完整交通数据的高精度插补,最后利用局部加权线性回归技术融合时间维和空间维的插补结果得到最终的插补数据。
技术领域
本发明涉及机器学习与智慧交通技术领域,一种基于时空集成学习的交通数据缺失值插补方法。
背景技术
交通数据是深入挖掘交通时空特性、感知交通状态以及预测交通趋势的基础。许多先进的交通管理程序和交通预测技术都需要完整、准确、可靠的交通数据。例如,交通控制系统需要完整的交通数据来生成适当的交通控制策略。但在实际应用中,受天气、温度、交通状态等外在环境以及设备维护、损坏、故障、传输错误、路由中断等内在因素的影响,使采集到的交通数据不完整。例如,北京的智能交通系统(ITS)采集到的日交通流量数据的缺失率通常在10%左右,有时甚至达到20%至25%之间。德州运输研究所的研究人员报告说,ITS采集到的数据的缺失率在16%到93%之间。交通数据缺失会导致大量信息丢失、数据质量下降,严重影响交通数据挖掘、交通状态估计和交通预测等进一步数据分析的性能。因此,如何结合机器学习技术,准确地插补交通数据缺失值,从而确保交通数据的完整性,是必要且具有现实意义的。
交通数据插补技术广泛,主要分为两类方法:一类是使用统计学模型建模交通数据的统计特征,依据部分现有数据直接估计模型参数,进而对缺失值进行插补;另一类是使用机器学习算法得到合理的预测值来插补缺失值。基于统计学的插补方法是指期望最大化、回归插补等方法。这类插补方法通过假设交通数据的强概率分布来估计缺失数据。然而,实际交通数据往往很难满足这些数据分布假设,因为交通数据具有随机性、周期性和空间依赖性。此外,这些独立方法有一个共同的缺点,即为缺失值插补唯一值,这无法解释交通数据插补的不确定性。多重插补方案可以克服这一缺点。该方案基于不同的模型为每个缺失值生成多个可能的插补值,然后对获得的插补数据集进行统计分析,以获得最终插补数据。基于机器学习的插补方法是指K近邻、多层感知器、支持向量回归、随机森林、去噪自编码、生成对抗网络等非参数模型,以及基于张量分解的方法。大多数基于机器学习的方法通过挖掘不同路段之间的相关性来插补缺失数据。这类方法能够有效地对复杂非线性的交通数据进行建模,但无法同时考虑交通数据的时空相关性,在时间维上考虑的不够全面,如忽略了交通数据的周期性和趋势性等多种固有特性。
虽然上述方法已得到广泛应用且取得一定效果,但对于插补不完整的交通数据仍存在一些问题有待改善:一方面,对于交通数据的时空特征的挖掘不够充分全面。在时间维度上,交通数据存在趋势性和周期性;在空间维度上,不同路段之间的交通数据存在空间相关性。另一方面,在实际场景中,交通数据存在不同缺失模式的各种组合。在组合缺失模式下,估计的难度大大增加,模型性能下降。
发明内容
本发明旨在插补交通数据,改善交通数据质量,提升交通数据挖掘、交通状态估计和交通趋势预测等进一步数据分析的性能。
为了解决上述问题,本发明的技术方案如下:
一种基于时空集成学习的交通数据缺失值插补方法,包括如下步骤:
步骤一:数据预处理:
将原始交通数据整合为以路段为列,以时间序列为行的二维交通数据矩阵;所述原始交通数据包括各路段单位时间内的车流量、车在路段各处检测点平均行驶速度和各路段的平均旅行速度;
步骤二、将原始交通数据进行时间特征表征和空间特征表征分别得到时间特征矩阵和空间特征矩阵;时间特征矩阵和空间特征矩阵分别作为时间维集成插补模型和空间维集成插补模型的输入;
步骤三、构建交通数据时间维集成插补模型:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111358967.3/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理