[发明专利]一种基于时空注意力机制的交通缺失数据补全方法有效
申请号: | 202110438939.6 | 申请日: | 2021-04-23 |
公开(公告)号: | CN113094357B | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 申彦明;徐文权;齐恒;尹宝才 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/2458;G06N3/04;G06N3/08 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 李晓亮;潘迅 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时空 注意力 机制 交通 缺失 数据 方法 | ||
1.一种基于时空注意力机制的交通缺失数据补全方法,其特征在于,包括以下步骤:
第一步、对原始数据进行预处理
获取所有车流量数据作为原始数据,对原始数据进行预处理,将数据按k分钟的时间间隔做聚合操作,同时去除异常值并进行数据的标准化处理;
第二步、根据数据的不同缺失模式处理数据
对第一步预处理后的数据进行数据点丢失处理,构建带有缺失点的数据集,记录缺失点所在的位置信息,同时保存缺失点对应的车流量数据真实值,作为验证值,用来验证数据补全模型的补全效果;
同时,结合缺失点所在的位置信息构建时空相关性衰减矩阵;当数据中存在缺失值时,利用其它存在观测值的点的信息来对当前缺失点补全时,通过构建时空相关性衰减矩阵来捕获相关性的衰减,其中时空相关性衰减矩阵包括时间维度影响衰减性矩阵、空间维度影响衰减性矩阵;
时间维度影响衰减性矩阵定义如下:
其中,表示第i个路段,t时刻的观测点和它时间上距离最近且存在观测值的点之间的时间间隔;Tt表示t时刻观测点在整个时间序列中的时刻信息;
空间维度影响衰减性矩阵定义如下:
其中,表示第i个路段,t时刻的观测点和它空间上距离最近且存在观测值的点之间的空间距离,Li表示第i个路段在整个路网中所在的位置信息;
的定义如下:
第三步、定义补全模型的输入,其输入由周期性输入和临近性输入组成:
所述临近性输入序列包括正向临近性输入序列和反向临近性输入序列:
正向临近性输入序列定义为:
其中,LSF表示模型需要的正向临近性输入数据时间观测窗口的长度;表示t时刻,长度为LSF的时间序列车流量观测值;
反向临近性输入序列定义为:
其中,LSB表示模型需要的反向临近性输入数据时间观测窗口的长度;表示t时刻,长度为LSB的时间序列车流量观测值;
所述周期性输入序列包括正向周期性输入序列和反向周期性输入序列;
正向周期性输入序列定义为:
其中,LPF表示模型需要的正向周期性输入数据时间观测窗口的长度;n表示模型输入所需要的周期数;ft,j表示在t时刻的周期数据集合内第j个周期的观测值;
反向周期性输入序列定义为:
其中,LPB表示模型需要的反向周期性输入数据时间观测窗口的长度;n表示模型输入所需要的周期数;ft,j表示在t时刻的周期数据集合内第j个周期的观测值;
第四步、构建数据补全模型;
结合第三步补全模型的输入,构建数据全模型;整个数据补全模型包括基于空间注意力机制的编码器模块、基于时间注意力机制的解码器模块、和基于时间卷积网络的周期性特征提取模块,各个模块的结构及训练机制如下:
(1)基于空间注意力机制的编码器模块:是由全连接网络和双向长短期记忆网络组合成的模型,通过全连接网络对输入序列进行特征提取和映射,降低输入序列的维度;使用双向长短期记忆网络对序列进行编码,编码的同时,利用空间注意力机制捕获其它路段对目标路段的影响;
基于空间注意力机制的编码器模块的实现过程:首先将正向临近性输入FFS和反向临近性输入FBS通过全连接网络进行映射,然后将降维后的向量输入Bi-LSTM网络中,通过空间注意力机制给不同的路段分配权重系数,最后输入Bi-LSTM单元中,在更新Bi-LSTM单元的隐藏层输出时,同时加入第二步得到的空间维度影响衰减性矩阵,获取编码器的输出;
(2)基于时间注意力机制的解码器模块:由多层长短期记忆网络组合,将编码器的输出作为输入,通过解码过程获取最终的缺失数据补全值;
基于时间注意力机制的解码器模块的实现过程:将编码器模块的输出作为输入,通过时间注意力机制捕获不同时间点和目标时间点的相关性程度并分配权重系数,然后输入LSTM单元中,在更新LSTM单元的隐藏层输出时,同时加入第二步得到的时间维度影响衰减性矩阵,获取解码器的输出;
(3)基于时间卷积网络的周期性特征提取模块:由多层时间卷积网络构成的模块;通过对周期性数据特征的提取,获取历史数据中、同一个传感器、同一个时间段车流量的变化规律,然后将提取到的特征输出;
基于时间卷积网络的周期性特征提取模块的实现过程:首先将正向周期性输入FFL和反向周期性输入FBL通过全连接网络进行映射,将输出的两个映射向量进行拼接,用基于无因果卷积的时间卷积网络对周期性特征进行提取;
第五步、将第二步处理后的数据集划分为训练集、验证集和测试集;在训练集上对模型进行训练获取最优参数,在验证集上对当前最优参数组合下模型的效果进行验证,在测试集上测试模型最终的补全效果;使用训练集数据对数据补全模型进行预训练,对模型的参数进行初始化;
第六步、在第五步获得的带有初始化参数的模型上,使用训练集和验证集数据对第四步构建的数据补全模型同时进行整体性训练,获取数据补全模型最优的参数组合:
将预处理后的数据分别输入到数据补全模型相应的模块中,同时对所有模块进行整体性训练;计算每次训练后的补全值和车流量数据的真值的损失函数值,将模型的参数训练到目标值;根据模型在训练集、验证集上的效果,不断调试模型的超参数,在减小过拟合的条件下提高补全精度;在使用验证集时,将数据补全模型的学习率设置为0,防止数据泄露的发生;
所述的输入数据包括:正向临近性输入表示t时刻前t1个时间间隔的车流量数据;反向临近性输入表示t时刻后t1个时间间隔的车流量数据;正向周期性输入表示t时刻前t2天内所有同一时刻的车流量数据;反向周期性输入表示t时刻后t2天内所有同一时刻的车流量数据;时间维度影响衰减性矩阵空间维度影响衰减性矩阵缺失点位置信息矩阵
经过一次迭代后,得到的是经过一次补全操作之后的车流量数据;将这次迭代后的数据作为下一次迭代的输入;
第七步、使用测试集利用第六步训练好的数据补全模型进行车流量数据补全;具体如下:
输入数据为:正向临近性输入反向临近性输入正向周期性输入反向周期性输入时间维度影响衰减性矩阵空间维度影响衰减性矩阵缺失点位置信息矩阵
通过第六步的数据补全模型得到缺失的车流量数据的补全值,和第二步进行丢失处理后得到的验证值进行对比,验证模型的补全效果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110438939.6/1.html,转载请声明来源钻瓜专利网。