[发明专利]交通状态预测方法和装置在审
申请号: | 201910228858.6 | 申请日: | 2019-03-25 |
公开(公告)号: | CN111738474A | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 黄晨;程建波;彭南博;黄志翔 | 申请(专利权)人: | 京东数字科技控股有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/30;G06N20/00;G08G1/01 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 张一军;张效荣 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 交通 状态 预测 方法 装置 | ||
本发明公开了一种交通状态预测方法和装置,涉及智能交通技术领域。该方法的一具体实施方式包括:根据训练路段的历史交通数据、第一时段交通数据以及与训练路段相邻的路段的第一时段交通数据,确定训练样本数据;其中,将所述历史交通数据作为第一数据源,训练路段的第一时段交通数据作为第二数据源,与训练路段相邻的路段的第一时段交通数据作为第三数据源;根据训练样本数据,分别确定每个数据源的权重和每个训练样本的权重;基于训练样本数据、每个数据源的权重、每个训练样本的权重和预设的损失函数,训练得到交通模型;基于交通模型,确定待预测路段的交通状态。该实施方式能够有效降低数据扰动的影响,提高交通预测的准确性。
技术领域
本发明涉及智能交通技术领域,尤其涉及一种交通状态预测方法和装置。
背景技术
近年来,随着大数据和机器学习技术的发展,各行各业都开始应用机器学习技术去建模及解决其相应场景的问题,但是由于底层数据源的不稳定或是噪音扰动等情况,难免会出现一个共有的问题:模型在建模学习阶段,数据源及样本均经过优选,是一种较为“理想”情况下的学习,然而模型实际上线后却由于种种原因出现各种数据扰动问题,从而导致模型上线后的效果变差,从而引发后续一系列问题。作为具体的例子,比如在交通拥堵的场景下,我们可以同时参考不同的交通路段通行数据来建模,然后预测未来一段时间内某路段是否会形成拥堵。但是在模型上线后,可能会存在某条路段没有历史数据的积累或是数据缺失的情况。
目前,常用的解决数据扰动问题的方法主要有:(1)在模型预测时对数据扰动影响到的样本进行剔除,即将缺失部分特征的样本剔除;(2)在模型预测时对数据扰动影响的样本进行缺失值填充,即使用预设的填充值对样本特征值进行填充,如填充该特征值的均值、中位数、零值等;(3)在建模阶段选择对缺失数据相对不敏感的树模型,如随机森林、xgboost算法(extreme gradient boosting,极端梯度提升算法)等,该类模型一般对特征中的缺失值做单独处理,得到最优结果。
在实现本发明过程中,发明人发现现有技术中至少存在如下问题:(1)对于在模型预测时对数据扰动问题影响到的样本进行剔除的方法,虽然可以保证预测的准确性,但是当数据扰动较大时,模型对样本的打分覆盖率会出现极大的下降,导致模型覆盖率不稳定。例如,当某个模型采用3个数据源的数据,当某个数据源整体出现缺失时,该数据源的样本覆盖率为0;(2)填充缺失值是一种牺牲预测准确性以减少样本损失,提高样本覆盖率的方法,这样的做法在实际出现数据扰动的情况下,往往会出现样本大量集中,模型难以发挥其应有的效果,即实际线上模型效果相对于训练时大幅下降;(3)训练对缺失数据不敏感的树模型,在模型选择上具有局限性,并且当数据源或特征大规模缺失时,树模型也无法解决问题,导致模型效果陡降。总而言之,目前常用的方法都不能完全解决数据扰动问题,不能得到稳健的结果。
发明内容
有鉴于此,本发明实施例提供一种交通状态预测方法和装置,能够有效降低数据扰动的影响,提高交通预测的准确性。
为实现上述目的,根据本发明实施例的一个方面,提供了一种交通状态预测方法,包括:
根据训练路段的历史交通数据、第一时段交通数据以及与所述训练路段相邻的路段的第一时段交通数据,确定训练样本数据;其中,将所述历史交通数据作为第一数据源,所述训练路段的第一时段交通数据作为第二数据源,与所述训练路段相邻的路段的第一时段交通数据作为第三数据源;
根据所述训练样本数据,分别确定每个数据源的权重和每个训练样本的权重;
基于所述训练样本数据、每个数据源的权重、每个训练样本的权重和预设的损失函数,训练得到交通模型;
基于所述交通模型,确定待预测路段的交通状态。
可选地,确定训练样本数据的过程包括:分别从所述第一数据源、第二数据源和第三数据源提取特征,以确定训练样本数据;其中,所述特征至少包括以下一种或几种:速度、车间距、车道占用率和预设间隔内的车流量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东数字科技控股有限公司,未经京东数字科技控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910228858.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:车辆防抱死能量回收控制方法及装置
- 下一篇:一种通讯方法及系统
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理