[发明专利]一种基于机器学习的地铁短时客流预测方法有效
申请号: | 201710573357.2 | 申请日: | 2017-07-14 |
公开(公告)号: | CN107291668B | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 王璞;凌溪蔓 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06N99/00;G06Q10/04 |
代理公司: | 长沙市融智专利事务所 43114 | 代理人: | 欧阳迪奇 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于机器学习的地铁短时客流预测方法,通过基于地铁拍卡数据,假设所有乘客均按照最短路径出行,统计所有区间,所有站点在单位时间窗内的流量。以单位时间窗内的地铁站点客流为节点,以单位时间窗内的地铁区间客流为边的权重,建立地铁客流网络。针对单一目标区间,挑选出对其影响最重要的特征纳入后续的回归预测模型。本方法采用递归特征消除算法完成特征选择,挑选出目标区间在目标时间窗内的重要特征。采用梯度提升回归树方法建立回归预测模型,实现地铁短时客流预测。本方法可以在数据源单一的情况下,达到较高的预测精度。利用历史数据建立回归预测模型,结合实时数据预测地铁短时客流,对城市轨道交通运营编组设计优化提供帮助。 | ||
搜索关键词: | 一种 基于 机器 学习 地铁 客流 预测 方法 | ||
【主权项】:
1.一种基于机器学习的地铁短时客流预测方法,其特征在于,包括以下步骤:步骤一:获取待统计的地点区间内的所有地铁刷卡记录;步骤二:根据步骤一的地铁刷卡记录,以乘客连续两次的进出站刷卡记录分别为一次出行的O和D,统计每日的乘客的出行OD,求出每日的地铁客流的OD分布;步骤三:按照步骤二求出的OD分布,统计每日待统计的地点区间内所有地铁区间在单位时间窗内的客流;同时,由步骤一中的地铁刷卡记录直接统计得到每日地铁所有站点在单位时间窗内的客流;步骤四:构建地铁客流网络G,以单位时间窗内的地铁站点客流为节点,以单位时间窗内的地铁区间客流为边的权重,建立地铁客流网络G;步骤五:对于待统计的地点区间内的每一个目标地铁区间,以步骤四中所建立的地铁客流网络G中的所有节点和边作为其备选特征,取特征训练数据集D={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rd,y∈R,矩阵X=(x1,x2,…,xn)T表示训练集样本的x输入,xi∈Rd,其中R表示实数,d表示维数,矩阵y=(y1,y2,..,yn)T表示训练集样本的y输入,yn与xn对应,构成一个样本,n为样本数,利用递归特征消除算法作为特征选择方法,找出目标时间窗内对每一目标地铁区间影响最大的前K个特征;步骤六:利用梯度提升回归树方法建立回归预测模型,将步骤五中挑选出的对目标区间影响最大的前K个特征,作为回归模型的输入,纳入后续的回归预测,此时输入的样本xi的维数是K维,目标值列矩阵y=(y1,y2,..,yn)T与特征选择方法中的目标值一致;所述的步骤五中,所述的递归特征消除算法包括以下步骤:步骤1:初始化:原始特征集合S={1,2,…,d},特征排序集步骤2:当S不为空时,执行步骤3,否则结束递归特征消除算法并输出特征排序集F;步骤3:获取候选特征集合的训练样本即训练数据集:D={(x1,y1),(x2,y2),…,(xn,yn)},xi∈Rd,d∈S,y∈R,作为输入;步骤4:利用线性回归模型:yi=ω0+ω1xi1+ω2xi2+…+ωdxid,得到每个特征的重要程度,即线性回归模型的系数ωk,k=1,2,…,d;步骤5:找出排序准则分数最小的特征p=arg minkωk,ωk表示第k个特征的排序准则分数即重要程度,此时对应线性回归的中的权重系数,p表示当前排序准则分数最小的特征,arg minkωk表示整个函数取最小值时,自变量k的取值,即p;步骤6:更新特征集F={p}∪F;步骤7:在S中去除特征S=S/p,返回步骤2。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710573357.2/,转载请声明来源钻瓜专利网。