[发明专利]一种基于双向循环神经网络的交通缺失数据补全方法在审
申请号: | 201911106967.7 | 申请日: | 2019-11-13 |
公开(公告)号: | CN110837888A | 公开(公告)日: | 2020-02-25 |
发明(设计)人: | 申彦明;徐文权;齐恒;尹宝才 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q50/26 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 梅洪玉;刘秋彤 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 双向 循环 神经网络 交通 缺失 数据 方法 | ||
1.一种基于双向循环神经网络的交通缺失数据补全方法,其特征在于,步骤如下:
第一步,将车流量数据进行预处理
所述的预处理包括时间粒度划分和对数据进行标准化;
第二步、将预处理后的数据进行随机数据点丢失处理,构建带有缺失点的数据集,然后记录缺失点所在的位置信息,用作验证值;同时,构建时间维度影响衰减性矩阵:
其中,nt表示当前的时刻,的定义如下:
第三步、将丢失处理后的车流量数据划分为训练集、验证集和测试集;在每个数据集中,不同模型采用的数据有以下几种类型:
前向时间序列深度学习模块用的数据:
反向时间序列深度学习模块的数据:
外部特征模块中采用的外部特征数据:Fn;
周期性特征模块中采用的周期性序列数据:
其中,n表示当前时刻,t表示时间序列的步长,p表示周期序列的步长;S表示的是车流量数据,T表示的是S在时间维度上的反向序列;si表示在n时刻的车流量数据,表示第n时刻的前i天的日内相同时刻的车流量数据,表示包括第n时刻的前t个时刻的车流量数据的集合,表示包括第n时刻当天的前p天日内相同时刻的车流量数据集合,Fn表示在第n时刻的外部特征,包括节假日、位置区域、天气和气温;
第四步、构建补全模型,补全模型包括前向时间序列深度学习模块、反向时间序列深度学习模块、周期性特征模块和外部特征模块,各个模块的结构及训练机制如下:
(1)前向时间序列深度学习模块:是一个线性回归网络和多层长短记忆网络组合LSTM模型,通过一层线性回归网络,添加当前缺失点在时间上的延续性信息,用来应对长时间序列缺失的情况,提升补全精度;
前向序列深度学习模块的实现细节:先将时间维度衰减性矩阵输入到线性回归网络,然后将线性回归网络的输出和前向时间序列数据输入LSTM网络中,对当前时刻输入值xt,如果数据点没有缺失,则直接输入,当数据点缺失时,将上一个时刻的隐含状态作为当前时刻的输入,在处理完输入后,对深度学习网络进行训练,在不断的迭代更新中得到最终的前向序列深度学习模块的输出;
(2)反向时间序列深度学习模块:在网络结构上与前向序列深度学习模块一致,不同的在于将前向时间序列深度学习模块的输入在时间维度上做一个反向处理,作为模块的输入;
(3)周期性特征学习模块:是由三层全连接网络构成的模块,通过对周期性数据特征的提取,获取历史数据中、同一个传感器、同一个时间段车流量的变化规律,然后将提取到的特征输出;实现细节:将周期序列数据输入到全连接层中,经过三层全连接层,提取周期性数据的时序性特征,然后输出;
(4)外部特征模块:该模块由两部分组成:第一部分处理节假日、天气特征,是一层特征编码层;实现细节:将外部特征数据输入到特征编码层,把数据转化为向量形式,然后把得到的向量和上述三个模块的输出合并;
第二部分处理空间性特征,将路段上所有传感器同时输入第二部分中,然后将与当前传感器的缺失点相同时刻的其它传感器的隐含状态作为输入,通过Softmax网络计算权重之后,得到输出,将该输出输入到前向、反向时间序列深度学习模块中;
最后将上述四个模块的输出合并成一维向量,通过一层全连接网络,得到最终的补全结果;
第五步、使用训练集数据对前向时间序列深度学习模块、反向时间序列深度学习模块的预训练部分进行预训练,提前优化时间序列深度学习模型的参数,避免在整体训练时将参数优化到局部最优点;
第六步、使用训练集数据和验证集数据对步骤四建立的四个模块进行整体性训练:
将预处理后的数据分别输入到相应的模块中,同时对所有模块进行整体性训练;计算每次训练后的补全值和车流量数据的真值的损失函数值,将模型的参数训练到目标值;根据模型在训练集、验证集上的效果,不断调试模型的超参数,在减小过拟合的条件下提高补全精度;
所述的输入数据包括:
前向时间序列数据:前t1小时的车流量数据
反向时间序列数据:后t2小时的车流量数据
周期序列数据:前t3天同一时刻的车流量数据
时间维度影响衰减性矩阵:
外部特征数据:第n时刻的节假日、区域、天气和气温外部特征数据Fn;
车流量数据的真值:当前时刻的车流量数据
经过一次迭代后,得到的是经过一次补全操作之后的车流量数据;将这次迭代后的数据作为下一次迭代的输入,之前缺失点虽然有了补全值,但是由于标签还是表示缺失,后续迭代过程中,目标还是对这些缺失点进行数据补全;
第七步、使用测试集利用第六步训练好的模型进行车流量数据补全;
输入数据为:前向时间序列数据反向时间序列数据周期序列数据时间维度影响衰减性矩阵外部特征数据和车流量数据的真值
通过第六步的模型得到缺失的车流量数据的补全值,和第二步进行丢失处理后得到的验证值进行对比,验证模型的补全效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911106967.7/1.html,转载请声明来源钻瓜专利网。