[发明专利]一种基于权重堆叠决策树的短时公交客流预测方法及系统在审
申请号: | 202110678413.5 | 申请日: | 2021-06-18 |
公开(公告)号: | CN113537569A | 公开(公告)日: | 2021-10-22 |
发明(设计)人: | 巫威眺;曾坤;夏弋松 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/26;G06N20/00;G06K9/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李君 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 权重 堆叠 决策树 公交 客流 预测 方法 系统 | ||
1.一种基于权重堆叠决策树的短时公交客流预测方法,其特征在于,包括以下步骤:
通过数据获取装置获取公交IC卡数据,所述公交IC卡数据包括客流信息和持卡人信息;
对公交IC卡数据进行预处理,提取客流特征信息和持卡人群特征信息,并将公交IC卡数据聚合为小时客流数据;
基于待预测线路所在地点和历史客流时间区间获取待预测线路特征数据,建立特征矩阵并进行归一化处理;所述待预测线路特征数据包括:小时、日期、周几、一年中第几周、一年中第几天、是否节假日、最高温、最低温、降雨量、空气指数;
对待预测线路特征数据之间进行独立性检验,将客流设定为预测标签,对不同的特征和预测标签之间进行相关性检验;得到预测标签相关度高的多源特征;
以绝对偏度为量化指标对多源特征进行正态分布检验,对绝对偏度大的特征进行Box-Cox变换,使得变换后的特征数据接近正态分布,和小时客流数据一同作为后续预测的基础数据;
构建权重堆叠梯度提升树模型;
将客流数据划分出训练集,通过权重堆叠梯度提升树模型对训练集进行训练,然后对预测时段的客流进行预测,得到预测结果。
2.根据权利要求1所述的一种基于权重堆叠决策树的短时公交客流预测方法,其特征在于,所述待预测线路特征数据包括当前测试时间、是否为节假日、当前温度、当前降雨量、空气质量。
3.根据权利要求1所述的一种基于权重堆叠决策树的短时公交客流预测方法,其特征在于,所述独立性检验,具体如下:设定存在X、Y两个变量,对这两个变量的T1、T2两种属性进行独立性检验,用χ2检验对影响因子之间的独立性,计算如下:
其中,a、b、c、d代表不同变量属性组合的样本频数;
假设有N个影响因子,则需要进行次检验,当检验结果显示某一对影响因子之间非独立时需要剔除其中一个。
4.根据权利要求1所述的一种基于权重堆叠决策树的短时公交客流预测方法,其特征在于,所述相关性检验,具体如下:
通过皮尔逊相关系数判断影响因子和客流之间的相关程度,皮尔逊相关系数实质上是两个变量X、Y之间的协方差与它们各自标准差乘积之间的比值,计算如下:
其中,cov(X,Y)表示协方差,σX表示变量X的标准差,σY表示变量Y的标准差,X表示变量X的值,表示变量X的平均值,Y表示变量Y的值,表示变量Y的平均值;
当ρX,Y的值在[-1,0]之间时,X、Y呈现负相关的特征;
当ρX,Y的值在[0,1]之间时,X、Y呈现正相关的特征;
当ρX,Y的绝对值显著趋于0时,表明X、Y之间相关性较弱;
当ρX,Y的绝对值显著趋于1时,表明X、Y之间相关性极强。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110678413.5/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理