[发明专利]一种基于大数据机器学习进行轨道交通停准问题预测方法在审
申请号: | 201910636347.8 | 申请日: | 2019-07-15 |
公开(公告)号: | CN110610016A | 公开(公告)日: | 2019-12-24 |
发明(设计)人: | 常伟;余捷全 | 申请(专利权)人: | 广东毓秀科技有限公司 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 510000 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 轨道交通 机器学习 问题预测 大数据 车辆实时数据 安全性指标 特征化处理 调整参数 计算模型 建立模型 数据整理 算法模拟 随机森林 验证算法 应用架构 预测算法 运行过程 运行数据 建模 优化 清洗 改进 行车 采集 评估 | ||
本专利涉及一种基于大数据机器学习进行轨道交通停准问题预测和改进方法,该方法由相应的应用架构、流程、计算模型组成。这种方法首先对轨道交通运行过程中采集的车辆实时数据,以及车辆其它的运行数据,进行数据整理和清洗,并对数据进行特征化处理,通过大数据机器学习建立模型和训练验证算法,其中建模主要使用了XGboost模型、生存模型和随机森林,并对结果进行不同角度的评估和优化,从而建立轨道交通停准问题预测的模型,优化轨道交通停靠准确性,提高行车的安全性指标,同时提供算法模拟,便于调整参数改进预测算法。
技术领域
本发明涉及一种基于大数据机器学习进行轨道交通停准问题预测的应用分析方法,应用的领域是进行轨道交通车辆停准性能评估。
背景技术
随着中国城市轨道交通的发展,越来越多的人会选择轨道交通出行。根据调查研究显示目前上海的轨道交通共有地铁17条,总长度达到了673公里,每天旅客人流达到1100万人次。其中轨道交通车辆的停准问题引起了地铁公司的关注,因为车辆的停准问题影响了地铁的运行效率和乘客的满意度问题。
车辆的停准问题,定义为车辆在完全停稳后,车辆的停车位置与预先设定的停车位置的重合度的问题,车辆停车位置没有到达预先设定的停车位置则为欠停,车辆停车位置超过了预先设定的停车位置则为过停。
本文采用一种利用机器学习的方法来进行轨道交通车辆停准问题的预测,在依赖于车辆数据采集的长周期情况下,从车辆的额定信息和状态监测数据(牵引力、制动力、车辆速度、温度、湿度等)挖掘其中隐含的车辆停准问题的状态信息及其演变规律,实现车辆停准问题预测。
发明内容
为了解决这个问题,本发明提供了一种数据驱动的车辆停准问题预测方法,就是基于大数据机器学习建立车辆停准问题预测的应用分析系统。所述方法包括:步骤001数据准备步骤,获取与轨道交通车辆使用相关的数据;所述轨道交通车辆的使用数据和环境数据;所述车辆的使用数据包括在正常使用时与车辆相关的自身数据以及状态数据;所述环境数据是指环境温度和湿度的信息;步骤002数据整理步骤,对所述车辆使用相关的数据进行清洗并将清洗后的所述车辆使用相关的数据基于时间单元进行数据构建;所述对数据进行清洗包括,采用取一段行程该变量的平均值或中间值或相邻插值进行空余变量的赋值;通过设定车辆使用相关数据的每个变量的阈值检查数据是否合乎要求将超出正常范围的数据予以删除或纠正;通过设定车辆使用相关数据的相互约束和依赖关系,将逻辑上不合理或者相互矛盾的数据予以删除或纠正;所述数据构建包括,按照时间的顺序将搜集到的数据进行整合;步骤003 数据特征化步骤,将通过数据整理步骤得到的数据进行总结和抽取,获取特征化后的数据;对于数据的总结和抽取包括滚动聚合,所述滚动聚合是指设定一个时间窗口,计算在预定的变量在该时间窗口内的聚合值,所述聚合值可以是数据的总和、平均值或者是标准差;所述总结和抽取还包括将特征变量进行扩展,所述扩展包括对初始的特征变量根据滚动聚合的均值增加相应的个数,以及对初始的特征变量根据滚动聚合的标准差增加相应的个数;步骤004 建立模型步骤,基于特征化后的数据建立车辆停准问题预测的模型,模型包括非XGBoost、生存模型和随机森林;步骤005训练验证步骤,对XGBoost、生存模型和随机森林进行训练和验证以优化该模型;所述训练验证步骤优选包括交叉验证,所述交叉验证包括,首先把原始的数据随机分成K个部分,在这K个部分中选择其中一个部分作为测试数据,剩下的K-1 个部分作为训练数据得到相应的实验结果;然后,挑选另外一个部分作为测试数据,剩下的 K-1个部分作为训练数据;以此类推,重复进行K次交叉检验,每次实验都从K个部分中选择一个不同的部分作为测试数据,保证K个部分的数据都分别做过测试数据,剩下的K-1个当作训练数据进行实验;最后把得到的K个实验结果平均;基于所述实验结果确定最佳的数据分类;步骤006算法评估步骤,评估数据的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东毓秀科技有限公司,未经广东毓秀科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910636347.8/2.html,转载请声明来源钻瓜专利网。