[发明专利]一种城市交通出行数据分析方法有效
申请号: | 202110616013.1 | 申请日: | 2021-06-02 |
公开(公告)号: | CN113344268B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 刘俊伟 | 申请(专利权)人: | 合肥泰瑞数创科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q30/02;G06F16/29 |
代理公司: | 北京中普鸿儒知识产权代理有限公司 11822 | 代理人: | 谢建玲 |
地址: | 230031 安徽省合肥市高新*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 城市交通 出行 数据 分析 方法 | ||
1.一种城市交通出行数据分析方法,其特征在于,包括以下步骤:
S1、获取多源交通出行数据,且数据包括公交IC卡数据、地铁卡刷卡数据、出租车运营数据、车载GPS数据、手机信令数据、道路监控数据、车辆识别数据以及交通支付数据;
S2、由于数据采集设备和传输设备不稳定和周围环境复杂性的影响,在设备数据采集和传输中会出现各种各样的错误,需要通过数据清洗和预处理,将原始带有缺陷的数据替换为高质量数据;
S3、基于处理后的数据挖掘出交通总需求以及各类交通运行情况,同时对每条出行记录进行上车站点、乘坐线路、下车站点的提取,确定实际出行的线路、换乘站点和最终站点,恢复个体乘客的出行链记录;
S4、利用数据融合技术得到交通出行轨迹,并深度挖掘数据的内在机理,根据数据之间的内在关联信息,进行推算、预估来获得潜在的信息;
S5、面对交通服务供需差异较为显著的区域,从基于站点及线路扩展的角度,建立面向服务覆盖的空间优化系统,获取交通线路布局优化的建议方案;
步骤S2中出现错误的类型包括地铁车载GPS数据丢失,对于地铁车载GPS数据丢失的具体补全步骤如下:
a、首先对每辆地铁按每一班次将其车载GPS记录的车辆报站数据按具体线路运行站点顺序进行排序,得到序列:{A1、A2、A3、A4…Ak};
b、与地铁调度信息进行比较,信息完整无需修复,不完整则找到报站信息缺失的区,且记作{Am、Am+1、Am+2、…An};
c、找出本车次所有乘车刷卡数据,设定连续刷卡时间间隔阈值,统计每一个刷卡的时间起点及终点,并对路段长度、交通量、车辆加速度的数据加以融合;
d、再将地铁车载GPS数据问题转化为地铁从站到站的行间预测问题,再借助数据,计算地铁到每个缺失站点的行程时间概率密度函数为:其中t为路段行驶时间,μ为位置参数,表示路段行驶时间对数lnt的期望值,σ为尺度参数,表示lnt的标准差;μ远大于σ时,行程时间概率分布函数可看成正态分布,路段行程时间的期望和标准差由下式求得:E(t)和SD(t)分别表示路段行程时间的期望和标准差,路段行程时间所对应的累计分布公式为:e、用刷卡数据计算A1站点从到Am站点的实际行程时间,用刷卡数据计算Ak站点从到An站点的实际行程时间,再带入步骤d中概率密度函数,得到的两个极大值分别为Am、An推断对应的站点;
步骤S5中空间优化系统的建立过程为:
a、首先对乘客输入的起点及终点信息进行预处理,当起点及终点为跨城区的线路,即建议乘客选择高铁出行,并自动规划出起点到高铁站的路线以及高铁终点站到客户输入终点站的路线;
b、将GPS电子地图栅格化,将乘客输入的起点及终点地理位置实时标记在电子地图中,且对应栅格几何中心点即为标记位置;
c、接着在起点及终点标记地理位置的圆形1km区域内检索是否具有地铁站点、公交站点,如果存在则规划起点标记位置到达站点的最优步行路线,反之不存在,则建议乘客选择打车出行方式;
d、步行路线规划后,接着可获取多源交通出行数据,借助大数据计算方法可得到若干条规划线路,且记作,每一条规划线路均括步行、打车、地铁及公交中一种或多种出行方式;
e、最后筛选出路程最短路线、时间最短路线及堵车最少路线。
2.根据权利要求1所述的一种城市交通出行数据分析方法,其特征在于:所述步骤S2中数据出现错误的类型包括异常数据、数据丢失及数据重叠,所述异常数据是指某些属性值的格式不正确或属性值明显超过正常取值范围的数据,明显不符合实际情况,超出时间正常取值范围;所述数据丢失是指卡数据、运营数据、GPS数据、手机信令数据、监控数据、车辆识别数据及交通支付数据中某个或者多个属性值出现丢失的问题;所述数据重叠是指在很短的时间内某些属性值多次出现,并对之后的数据融合造成干扰。
3.根据权利要求2所述的一种城市交通出行数据分析方法,其特征在于:所述异常数据的处理方法为:对异常数据的呈现的格式与正常数据进行对比,并设置正常数据的范围,当出现异常数据需将其删除,并记录错误内容及错误类型;所述数据丢失的处理方法为:匹配出数据丢失的属性及具体位置,再与属性内其他数据进行关联补全;所述数据重叠的处理方法为:设定最小时间间隔阈值,如果同一属性值出现的时间间隔小于该阈值,则认定为属性值,并保留一个属性值,其他多余重复属性值进行删除。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥泰瑞数创科技有限公司,未经合肥泰瑞数创科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110616013.1/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置