[发明专利]一种基于GRU神经网络的公交到站时间预测方法有效
申请号: | 201910162263.5 | 申请日: | 2019-03-05 |
公开(公告)号: | CN109920248B | 公开(公告)日: | 2021-09-17 |
发明(设计)人: | 施佺;陆俊天;孙玲;曹阳;沈琴琴;朱森来 | 申请(专利权)人: | 南通大学 |
主分类号: | G08G1/01 | 分类号: | G08G1/01;G08G1/123;G06N3/04;G06N3/08 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 王素琴 |
地址: | 226007*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gru 神经网络 公交 到站 时间 预测 方法 | ||
1.一种基于GRU神经网络的公交到站时间预测方法,其特征在于,所述方法包括:
S1、由数据库导出历史数据至CSV格式文件,获取原始数据,利用HBase分布式数据库和Spark内存处理技术对所述原始数据进行分析处理去除所述原始数据的混杂性、复杂性和系数性;
S2、基于单一属性和多因子角度采用特征相关性研究法处理分析处理后的所述原始数据,得到标准时间序列类型数据;
S3、利用Lasso方法对所述标准时间序列类型数据进行变量选择,剔除所述标准时间序列类型数据中关联性弱的特征向量;
S4、基于GRU神经网络构建公交的到站预测模型,输入已剔除关联性弱特征向量的所述标准时间序列类型数据至所述到站预测模型,实现对公交到站的时间预测操作;
步骤S1包括:
S11、利用SparkSQL从HDFS中获取所述CSV格式文件,形成Spark DataFrame结构数据;
S12、利用SparkSQL提取指定公交的历史GPS轨迹数据,并利用HBase分布式数据库将所述历史GPS轨迹数据与公交站点距离进行匹配;
所述利用HBase分布式数据库将所述历史GPS轨迹数据与公交站点距离进行匹配,包括:
S121、设定一特定值用于判断所述匹配是否小于公交的指定到站地点,若所述匹配的结果小于所述特定值,则标记与所述匹配对应的公交到站地点;
S122、将所述匹配按时间顺序任取时间间隔大于t秒的两个GPS定位点,根据两个定位点连线的斜率判断公交的上下行运行状况;
S123、选取所述匹配中与站点最近的定位时间,基于公交的运行速度和加速度,记录到站时间;
S124、以到站时间和公交对应的车辆号对所述原始数据进行排序,并利用Spark输出存储至HDFS中。
2.如权利要求1所述的基于GRU神经网络的公交到站时间预测方法,其特征在于,所述公交到站地点与实际定位地点的距离通过Greate-Circle距离计算公式计算,所述Greate-Circle距离计算公式为:
其中,R是地球半径,Aj,Aw分别为实际定位地点的经度、纬度;Bj,Bw分别为公交到站地点的经度、纬度。
3.如权利要求1所述的基于GRU神经网络的公交到站时间预测方法,其特征在于,所述斜率的计算过公式为:
式中,Dlon、Dlat代表线路上行终点站经度、纬度,Slon、Slat代表线路上行起点站经度、纬度,Alon、Alat代表后车辆行驶轨迹的后一站经度、纬度,Blon、Blat代表前一站经度、纬度;其中,若K0,则表示与为上行线路同向,即上行,反之则为下行。
4.如权利要求1所述的基于GRU神经网络的公交到站时间预测方法,其特征在于,步骤S223通过公式其中,s为最近一次定位点离站点距离,v0为所述公交到站地点处公交的行使速度,vt为到站速度,默认为0,t为最近一次定位点到公交站点所用的时间。
5.如权利要求1所述的基于GRU神经网络的公交到站时间预测方法,其特征在于,所述Lasso方法定义公式为:其中,xij为第i组j个变量,行向量β为回归系数,y表示训练标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910162263.5/1.html,转载请声明来源钻瓜专利网。