[发明专利]一种基于时空集成学习的交通数据缺失值插补方法在审
申请号: | 202111358967.3 | 申请日: | 2021-11-17 |
公开(公告)号: | CN114004421A | 公开(公告)日: | 2022-02-01 |
发明(设计)人: | 于明霞;秦拯;肖竹;张吉昕;梁晋文 | 申请(专利权)人: | 湖南大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 长沙麓创时代专利代理事务所(普通合伙) 43249 | 代理人: | 贾庆 |
地址: | 410082 湖南省*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 集成 学习 交通 数据 缺失 值插补 方法 | ||
1.一种基于时空集成学习的交通数据缺失值插补方法,其特征在于,包括如下步骤:
步骤一:数据预处理:
将原始交通数据整合为以路段为列,以时间序列为行的二维交通数据矩阵;所述原始交通数据包括各路段单位时间内的车流量、车在路段各处检测点平均行驶速度和各路段的平均旅行速度;
步骤二、将原始交通数据进行时间特征表征和空间特征表征分别得到时间特征矩阵和空间特征矩阵;时间特征矩阵和空间特征矩阵分别作为时间维集成插补模型和空间维集成插补模型的输入;
步骤三、构建交通数据时间维集成插补模型:
设立若干个串联的弱学习器,第一个弱学习器的输入是时间特征矩阵,其他的弱学习器的输入是时间特征矩阵和前一个弱学习器倒数第二层网络的输出特征,然后采用平均法的组合策略计算多个弱学习器的插补结果,利用反向传播算法更新模型参数,最后通过最小二乘法训练梯度增强长短时记忆网络得到最终的交通数据时间维集成插补模型;
步骤四、构建交通数据空间维集成插补模型:
空间特征矩阵输入到AdaBoost回归模型中,通过迭代训练多个弱学习器,得到最终的强学习器作为交通数据空间维集成插补模型;
步骤五、最终的交通数插补结果:将交通数据进行时间特征表征和空间特征表征得到时间特征矩阵和空间特征矩阵;将时间特征矩阵输入交通数据时间维集成插补模型得到时间维集成插补模型估计结果y1,将空间特征矩阵输入交通数据空间维集成插补模型得到空间维集成插补模型估计结果y2;综合y1和y2得到最终的交通数插补结果。
2.如权利要求1所述的基于时空集成学习的交通数据缺失值插补方法,其特征在于,所述最终的交通数据插补结果用于进行交通状态估计和交通状况预测。
3.如权利要求1所述的基于时空集成学习的交通数据缺失值插补方法,其特征在于,所述步骤二中,待插补路段的时间特征矩阵X表示为:X=(Xr,Xd,Xw),其中表示所有路段与待插补时段直接相邻的历史T个时间片段的完整交通数据,表征了交通数据的近期趋势性,N表示路网中路段的数量;表示所有路段与待插补时段直接相邻的第i个时间片段的交通数据,r表示近期周期,d表示日周期,w表示周周期;RN×T表示任意一个都是实数,数据维度大小是N×T;用于表征第ti个插补时段的近期特征,Tr表示一个近期周期被分割成的时间片的数量,ti表示第ti个插补时段,表示与第ti个插补时段相距Tr个时间片的历史交通数据,表征与第ti个插补时段相距Tr-1个时间片的历史交通数据;表示所有路段的待插补时段的日周期数据;其中,表征第ti个插补时段的日周期特征,Td表示一个日周期被分割成的时间片的数量,q表示日采样频率;表示与第ti个插补时段相距(Td-1)×q个时间片的历史交通数据;表示所有路段的待插补时段的周周期数据;其中,表征第ti个插补时段的周周期特征,Tw表示一个周周期被分割成的时间片的数量,表示与第ti个插补时段相距7×(Tw-1)×q个时间片的历史交通数据。
4.如权利要求1所述的基于时空集成学习的交通数据缺失值插补方法,其特征在于,所述步骤二中,待插补路段的空间特征矩阵表征为其中,yt表示待插补路段在t时刻的交通数据,xt表示与待插补路段相连通的其他路段的在t时刻的交通数据,m表示待插补路段的数据样本数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111358967.3/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理