[发明专利]一种基于贝叶斯增强张量的缺失交通数据修复方法有效
申请号: | 201910319516.5 | 申请日: | 2019-04-19 |
公开(公告)号: | CN110223509B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 何兆成;陈一贤 | 申请(专利权)人: | 中山大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G06N7/00 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 增强 张量 缺失 交通 数据 修复 方法 | ||
本发明公开了一种基于贝叶斯增强张量分解的缺失交通数据修复方法,步骤如下:将路网车速数据组织成一个3阶数据张量引入显性因子结构进行建模;输入数据张量,指示张量;更新全局参数μ的后验分布;更新超参数的后验分布;更新偏置参数φ的后验分布和因子矩阵参数U的后验分布,直到i=m;更新偏置参数θ的后验分布和因子矩阵参数V的后验分布,直到j=n;更新偏置参数η的后验分布和因子矩阵参数X的后验分布,直到t=f;重复步骤S4~S9直到精度参数τ与前一代的参数τ的差Δτε时,则模型收敛,进入下一步;利用更新后的{μ,φ,θ,η,U,V,X}参数值,代入yijt的表达式中计算估计张量
技术领域
本发明涉及智能交通系统技术领域,更具体的,涉及一种基于贝叶斯增强张量的缺失交通数据修复方法。
背景技术
数据缺失已经成为了智能交通系统领域的一个普遍且不可避免的问题,造成该问题的原因是多样的。首先由于部分交通数据的天然稀疏性,无法有效地对其进行完整的采集。此外,从交通管理成本的角度考虑,传感器有限的空间分布限制了数据的完备性。再者,数据采集设备本身的通讯故障以及传输失效等不确定性因素是另一个常见的因素。因此,能够准确地对缺失数据进行修复并增强数据质量对于支撑智能交通系统的应用是很有必要的。
以路段车速为例,路段车速是一种重要的交通流参数,可以用于行程时间计算与预测,在路网交通状态评估等领域扮演着重要的角色。我们通常使用浮动车GPS数据(出租车和营运车等)来估算浮动车的运行速度,并进一步取其均值作为路段车速。由于浮动车的时空覆盖范围不一,且网络传输不稳定,不同路段在不同的时间下会产生不同程度的数据缺失,造成数据质量欠佳,影响其后续应用。
路网交通数据蕴含着时空变化规律,通过提取其时空多维特征可以对缺失值进行修复。现有的基于张量分解的交通数据填补技术无法同时挖掘出显性和隐性的交通特征,因而导致数据估计不够准确且模型解释性较差。
发明内容
本发明对城市交通数据,尤其是路网车速数据进行分析,发现路段车速值在时间和空间上具有密切的关联关系,从而形成时空的交通模式。基于这种特性,为了在数据缺失的路段上对齐车速值进行修复,提出了一种基于贝叶斯增强张量的缺失交通数据修复方法,其能有效对缺失数据进行修复,实现数据质量增强。
为实现上述本发明目的,采用的技术方案如下:一种基于贝叶斯增强张量分解的缺失交通数据修复方法,所述该修复方法包括以下步骤:
S1:将路网车速数据组织成一个3阶数据张量数据张量中的每一个yijt表示第i个路段,第j天和第t个时间窗的车速值;采用张量CP分解把多维数据映射到低维隐性因子空间中,得到不同维度复杂的联系被建模成隐性空间因子的内积,并引入了显性因子结构,使得显性因子与隐性因子在分解过程中相互作用,从而进行建模,其数学表达:
式中:是所有元素的全局参数;φ表示路段维度的偏置向量,θ表示天维度的偏置向量,η表示时间窗维度的偏置向量,uik表示U矩阵的元素,vjk表示V矩阵的元素,xtk表示X矩阵的元素,U、V、X是数据张量分解得到的因子矩阵,r是CP分解的秩,表示所有的索引元素(i,j,k);
S2:采用贝叶斯推断方法从数据张量中学习出模型的全部参数{μ,φ,θ,η,U,V,X},采用高斯分布假设和对建模参数配置共轭先验进行定义贝叶斯增强张量分解模型;
S3:输入部分数据张量指示张量其中:Ω表示观测值索引的集合,对应着一个与大小相当的张量若中的每一个元素则yijk数据值存在,否则
S4:更新全局参数μ的后验分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910319516.5/2.html,转载请声明来源钻瓜专利网。