[发明专利]一种基于稀疏GPS数据的公交行程时间预测方法有效
申请号: | 202110111089.9 | 申请日: | 2021-01-27 |
公开(公告)号: | CN112907953B | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 宋现敏;田婧;李志慧;吴丛;张明业;曹倩;马永建;冷宁;张璐雨 | 申请(专利权)人: | 吉林大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06N3/04;G06N3/08;G06Q10/04;G06Q50/26 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 时起磊 |
地址: | 130023 吉林省长春市南关区人民*** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 稀疏 gps 数据 公交 行程 时间 预测 方法 | ||
1.一种基于稀疏GPS数据的公交行程时间预测方法,其特征在于:所述方法具体过程为:
步骤一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵;
步骤二、构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;
步骤三、基于无模型自适应驱动方法,在线预测公交行程时间;
所述步骤一中接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理,并将归一化预处理后的数据整合为二维时空速度矩阵;具体过程如下:
步骤一一、接收到公交车辆上传的原始GPS数据后,对公交原始GPS数据进行归一化预处理;过程为:
1)接收到公交车辆上传的原始GPS数据后,将速度超过公交最高限速值的数据视为异常值并删除;
2)对公交车辆上传的原始GPS数据进行归一化处理;归一化处理的公式为:
其中,v和v*分别是公交车辆上传的原始的速度数据和归一化处理后的速度数据,vmin和vmax分别是公交车辆上传的原始数据中速度的最小值和最大值;
步骤一二、将归一化处理后的速度数据整合为速度矩阵;
在构建速度矩阵时,首先按照20米间隔将公交线路划分为xn个路段{x1,x2,...,xi,...,xn};其次,统计各个路段每5分钟的归一化处理后的公交GPS数据得到时间序列{t1,t2,...,tj,...,tm};
如果路段xi在第tj个5分钟的时间间隔内采集到了公交数据,设i是速度矩阵的行数,j是速度矩阵的列数,(i,j)索引对应速度矩阵中一个数据点,则速度矩阵中位置(i,j)处数据的取值为采集到的公交数据速度的平均值;否则,速度矩阵对应位置取空值;
所述步骤二中构建基于交通流先验规则的生成式对抗网络,生成契合实际的公交线路交通状态;具体过程为:
步骤二一、构建基于交通流先验规则的生成式对抗网络;
步骤二二、对构建的基于交通流先验规则的生成式对抗网络中生成器和判别器进行端对端迭代训练,得到训练好的生成式对抗网络;
步骤二三、基于训练好的生成式对抗网络,生成契合实际的公交线路交通状态;
所述步骤二一中构建基于交通流先验规则的生成式对抗网络;具体过程为:
生成式对抗网络包括生成器G和判别器D两部分;
步骤二一一、构建生成器;
构建真实掩膜矩阵:
遍历速度矩阵里的每一个位置,若该位置有观测到的速度值,则真实掩膜矩阵的同一位置记为“1”,否则记为“0”,得到真实掩膜矩阵;
构建噪声矩阵:
先拟定一个尺寸与速度矩阵相同的零矩阵,然后搜索所有未观测到速度的时空位置,记为“0”;观测到速度的时空位置,记为“1”,从一个二维高斯分布中随机采样数据点对“0”进行填补,得到噪声矩阵;
所述二维高斯分布的具体形式为:
其中,z(x,t)为噪声;σn为噪声分布的方差,取5;x和t分别为搜索到的未观测到速度的空间、时间位置;
生成器中包括编码器与解码器,编码器与解码器两大部分具体如下:
第一部分:编码器部分;
编码器包含第一卷积神经网络层、第一平均池化层、第二卷积神经网络层、第二平均池化层、第三卷积神经网络层、第三平均池化层,第一卷积神经网络层的卷积核尺寸为5×5,第二卷积神经网络层的卷积核尺寸为3×3,第三卷积神经网络层的卷积核尺寸为2×2;
第一卷积神经网络层的输出层连接第一平均池化层的输入层,第一平均池化层的输出层连接第二卷积神经网络层的输入层,第二卷积神经网络层的输出层连接第二平均池化层的输入层,第二平均池化层的输出层连接第三卷积神经网络层的输入层,第三卷积神经网络层的输出层连接第三平均池化层的输入;
将速度矩阵、真实掩膜矩阵及噪声矩阵输入第一卷积神经网络层的输入层,经第一平均池化层、第二卷积神经网络层、第二平均池化层、第三卷积神经网络层、第三平均池化层输出公交线路交通状态特征矩阵;
第l卷积神经网络层的计算过程如下:
利用二维卷积运算对公交线路交通状态进行特征映射变换,计算方法如下:
其中,为第l层卷积网络使用的卷积核;m和z分别为速度对应的真实掩膜和噪声取值;为第l层卷积运算后输出的公交线路交通状态特征矩阵,l=1,2,3,其中取值为步骤一一归一化处理后的速度数据v*;*为卷积运算符号;
第l层平均池化层的计算过程如下:
卷积运算后,采用平均池化缩减公交线路交通状态特征,平均池化的计算公式如下:
其中,k为所有的速度点数;为第l层卷积运算后进行平均池化求得的交通状态特征矩阵中的第q个公交速度点值;为第l层卷积运算输出的交通状态特征矩阵中的第u个数据点;为对应的权重;
由公式(5)确定,表达式为:
其中,和分别为所在的空间和时间位置;和分别为所在的空间和时间位置;
第二部分:解码器部分;
解码器包含第一上采样单元、第二上采样单元、第三上采样单元,第一上采样单元采用的反卷积核尺寸为2×2,第二上采样单元采用的反卷积核尺寸为3×3,第三上采样单元采用的反卷积核尺寸为5×5;
将编码器的第三平均池化层输出的公交线路交通状态特征矩阵输入第一上采样单元,第一上采样单元的输出及编码器中第三平均池化层的输出连接第二上采样单元的输入,第二上采样单元的输出及编码器中第二平均池化层的输出连接第三上采样单元的输入,第三上采样单元的输出最终生成公交线路交通状态矩阵;
上采样单元计算步骤如下:
1)首先,上采样单元通过反卷积将编码器提取的公交线路交通状态特征扩大重构为完整的公交线路交通状态矩阵,反卷积的计算方法如下:
其中,为第l层上采样单元使用的反卷积核;为第l层反卷积运算后输出的还原交通状态特征矩阵,l=1,2,3,其中取值为编码器第三平均池化层输出的公交线路交通状态特征矩阵**为反卷积运算符号;
2)将第l-1层反卷积计算结果与第4-l层卷积输出结果作差,求得第l-1层反卷积计算的误差计算公式如下:
其中,为第l-1层反卷积计算误差;为第l-1层上采样单元生成的公交线路交通状态矩阵;为第4-l层平均池化层提取的交通状态特征矩阵,由公式(4)计算得到;l的取值范围为l=1,2,3,当l=1时,第一层上采样单元的输入为编码器的第三层平均池化层的输出,即和取
3)将误差通过反卷积扩大维度,并利用全连接层来预测第l层上采样单元交通状态估计误差
反卷积层计算公式为:
其中,为第l层上采样单元中误差反卷积网络使用的反卷积核;**为反卷积运算符号;为特征扩维后的第l-1层上采样单元交通状态还原误差;
全连接层的计算公式为:
其中,和分别为第l层上采样单元中使用的全连接层权重和偏置;为预测的第l层上采样单元交通状态估计误差;
4)最终,将与公式(6)计算得到的还原交通状态特征矩阵相加,得到误差反馈矫正后的公交线路交通状态生成结果:
其中,为第l层上采样单元生成的交通状态矩阵;
步骤二一二、构建判别器;
判别器的输入为生成器生成的交通状态矩阵,判别器的输出为估计的掩膜矩阵;
判别器中包括编码器与解码器,编码器与解码器和生成器相同;
步骤二一三、建立生成器的损失函数和判别器的损失函数作为网络的优化目标;
生成器的损失函数为:
其中,mr为步骤二一一计算的第r个数据点的真实掩膜值;为判别器估计的第r个数据点的估计掩膜值;α为超参数;为步骤一一中归一化处理后第r个数据点的速度;为生成器估计的第r个数据点公交速度;h为估计的速度点个数;
判别器的损失函数为交叉熵函数:
所述步骤二二中对构建的基于交通流先验规则的生成式对抗网络中生成器和判别器进行端对端迭代训练,得到训练好的生成式对抗网络;具体过程如下:
步骤二二一、利用贝叶斯搜索方法确定超参数α的取值并随机初始化生成式对抗网络中参数W、b,α、W、b组成待寻优参数集;
步骤二二二、将步骤一二的速度矩阵、步骤二一一生成的噪声矩阵及真实掩膜矩阵输入生成器中得到完整的公交线路交通状态生成矩阵;
然后将得到的完整的公交线路交通状态生成矩阵和步骤二一一得到的真实掩膜矩阵输入判别器中,得到判别器估计的掩膜矩阵;利用步骤二一一得到的真实掩膜矩阵数据和判别器估计的掩膜矩阵数据,按照公式(11)和公式(12)分别计算出生成损失和判别损失;
步骤二二三、设生成器的待寻优参数集为δ,生成器参数的更新规则如下:
其中,为待寻优参数集δ的梯度算子;v*为步骤一一中归一化处理后的速度;为
第e步迭代生成的公交交通状态;为第e步迭代计算的生成损失;k为所有的速度点数;δ(e)、δ(e-1)分别为第e步和第e-1步迭代时生成器的待寻优参数集的取值;
设判别器的待寻优参数集为θ,判别器参数的更新规则如下:
其中,为待寻优参数集θ的梯度算子;为第e步迭代计算的判别损失;m为步骤二一一所计算的真实掩膜值;为第e步迭代估计的掩膜值;k为所有的速度点数,θ(e)、θ(e-1)分别为第e步和第e-1步迭代时判别器的待寻优参数集的取值;
当生成损失和判别损失收敛时,终止训练过程,得到训练好的生成式对抗网络;
所述步骤二三中基于训练好的生成式对抗网络,生成契合实际的公交线路交通状态;具体过程为:
将经归一化处理的公交速度矩阵输入训练好的生成式对抗网络中得到生成的输出结果,再将输出结果反归一化还原,即可生成契合实际的公交线路交通状态;
所述步骤三中基于无模型自适应驱动方法,在线预测公交行程时间;具体过程为:
步骤三一、从步骤二生成的公交线路交通状态矩阵中选取待预测时间段t对应的列向量,将各路段按照道路的前进方向由小到大编号,用各路段长度除以该路段对应的速度,求得各路段的行程时间观测值,最终获得第t时段的公交行程时间观测值T的空间序列:
Tt′(x)={Tt(1),Tt(2),Tt(3),...,Tt(x-1),Tt(x)} (15)
其中,Tt(1)为第t时段,第1个路段的公交行程时间观测值,Tt(x)为第t时段,第x个路段的公交行程时间观测值;
将空间序列上各相邻路段的行程时间相减求差,计算得各路段的行程时间变化量,具体形式如公式(16)所示:
其中,Cp和Cf分别为无模型自适应公交行程时间预测的输入及输出的伪阶数;为公交线路上各路段的行程时间变化量;△Tt(x)为第t时段,第x-1个路段与第x个路段间行程时间观测值的差值;为第t时段,第x-1个路段与第x个路段间行程时间预测值的差值;
在开始计算前,给设置初始值,△Tt(·)从公式(15)表达的行程时间的空间序列中直接计算即可,取值与△Tt(·)相同;
步骤三二、在确定了公交线路上各路段的行程时间变化量后,构建伪梯度向量计算行程时间的变化率;
伪梯度向量的具体形式为:
其中,为与相对应的行程时间变化率向量,和的各个分量一一对应,φa(x)代表公交线路上各路段的行程时间变化量中第a个分量对应路段的行程时间变化率;a=1,...,CP,CP+1,...,CP+Cf;
伪梯度向量的具体计算过程如下所示:
1)以预测路段前一时间段的公交行程时间作为预测期望值;前一时间段的公交行程时间是通过将步骤三一中待预测时间段t对应的列数减一作为列索引,将预测路段编号作为行索引;
最终以预测路段前一时间段的公交行程时间作为预测期望值,预测期望值E(x+1)的具体计算方法如公式(18)所示:
Et-1(x+1)=Tt-1(x+1) (18)
其中,t为预测时段,x+1为待预测行程时间公交线路路段的紧邻下游路段,Tt-1(x+1)为第x+1个路段在t-1时段的公交行程时间,Et-1(x+1)为第x+1个路段在t-1时段上公交行程时间期望值;
将第x+1个路段在t-1时段和t-2时段公交行程时间相减,得到第x+1个路段公交行程时间期望值的变化量△Et-1(x+1),计算公式如下:
△Et-1(x+1)=Et-1(x+1)-Et-2(x+1) (19)
其中,△Et-1(x+1)为第x+1个路段在t-1时段与t-2时段上公交行程时间期望值的变化量;Et-1(x+1)为第x+1个路段在t-1时段上公交行程时间期望值;Et-2(x+1)为第x+1个路段在t-2时段上公交行程时间期望值;
2)求得公交行程时间预测期望值后,伪梯度的计算方法如公式(20)所示:
其中,κ、ηx为权重因子;△Et-1(x+1)为第x+1个路段在t-1时段与t-2时段上公交行程时间期望值的差值;
3)对伪梯度向量进行修正,修正过程为:
或
其中,υ为无穷小的常数;
步骤三三、在求得伪梯度向量即路段行程时间的变化率后,根据变化率预测路段上行程时间的变化量,从而更新公交行程时间预测模型式(23)的输入向量中的分量具体地计算方法如下:
其中,ρd、κu为权重因子;
步骤三四、在更新后的伪梯度向量与输入向量的驱动下,预测公交行程时间;具体为:
其中,为第x+1个路段在第t时段的公交行程时间预测值;
重复步骤三一至三四,滚动预测第t时段时,x+2、x+3、…、x+g下游路段的公交行程时间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吉林大学,未经吉林大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110111089.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置