[发明专利]一种基于GPS轨迹数据的出行段识别方法在审
申请号: | 201710537466.9 | 申请日: | 2017-07-04 |
公开(公告)号: | CN107330088A | 公开(公告)日: | 2017-11-07 |
发明(设计)人: | 汪宝;高林杰;隽志才 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G01S19/42 |
代理公司: | 上海伯瑞杰知识产权代理有限公司31227 | 代理人: | 王一琦 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gps 轨迹 数据 出行 识别 方法 | ||
技术领域
本发明涉及计算机识别技术,尤其涉及一种基于GPS轨迹数据的出行段识别方法。
背景技术
传统居民出行调查一般采用面对面访谈、纸质问卷、邮件和电话等形式,这些方法需要受访者填写详细的出行特征,并且是在一天或者更长时间段内出行结束后进行回忆填写,受访者的负担较大,填写的数据存在较大误差。比如,1)出行者通常将出行时间近似为相近的5分钟、10分钟甚至15分钟等,也不提供实际的出行路径等信息;2)出行调查的漏报、误报比例较高,通常处于20%-30%之间,这些都限制了出行数据的精度。
近些年,随着智能手机的快速普及,GPS定位技术的发展完善,使得基于手机GPS轨迹数据的出行调查成为可能。
现有的基于GPS轨迹数据的出行段识别方法主要存在以下不足:
1)由于GPS信号可能存在误差,现有方法直接使用GPS记录数据中的速度值进行相关计算就会出现较大偏差;
2)缺乏完善的原始数据清洗与预处理方法,如信号漂移点的识别与去除;
3)在识别得到出行端点后,缺乏进一步的判定与去除伪端点的方法;
4)没有按照传统的出行定义去合并出行段。
因此,识别得到的出行段与真实的出行之间存在较大偏差,方法实用性不强。
发明内容
为解决上述技术问题,本发明的目的在于提供一种基于GPS轨迹数据的出行段识别方法。
本发明是通过以下技术方案实现的:主要包括数据清洗与预处理、识别出行端点并去除伪出行端点、合并出行段。该方法在综合基于规则法和聚类法优点的基础上,提出了数据清洗与预处理流程,有效剔除了出行端点识别与出行段合并中的噪声。用轨迹点相邻区间的距离与时间差计算该点瞬时速度,运用速度对时间的积分来计算出行距离。适用于基于GPS轨迹数据的出行段识别,丰富GPS轨迹数据挖掘算法体系,为大规模基于智能手机的出行调查推广提供理论支撑。
一种基于GPS轨迹数据的出行段识别方法,其特征在于:包括以下步骤:
第一步、数据清洗与预处理;
1)去除定位卫星数少于4颗的轨迹点;
2)去除海拔高度大于当地最高海拔的轨迹点;
3)信号漂移点识别与剔除:该点与之前5个点的中心距离超过200米,同时与之后5个点的中心距离超过200米;
4)去除瞬时速度超过地面交通工具最大速度的轨迹点;
第二步、识别出行端点并去除伪端点;
根据GPS信号记录情况分两种情形识别出行端点,
1)GPS信号正常记录:出行端点处的轨迹点有点聚集的特征,用K均值聚类法识别此类端点;还有一种端点发生在短暂的接送人情形下,通过计算轨迹点的方向变化以及路段重复长度识别,方向发生180度的改变,且重复路段长度超过50米,即识别为接送人的出行端点;
2)GPS信号缺失:缺失段时间差超过2分钟,且缺失段平均速度(缺失段长度与时间差的比值)小于步行速度最小值0.5m/s,即识别为出行端点;
第三步、合并出行段;
第二步得到的出行端点即活动发生点,去除活动范围小于50米的出行端点,得到所有的出行端点,合并各出行端点之间的出行段。
进一步的,第二步所述的K均值聚类法识别可能的出行端点,定义一个簇并给定簇内最少的点数m=5个和聚类半径d=10米,判断该簇中位点和簇外下一点之间的距离,如果小于d/2,则将该点加入簇中,否则结束该簇,直到所有的点都被遍历到,最终建立的各簇即为可能的出行端点,每一个簇的时间差至少为2分钟,否则作为伪端点并去除。
进一步的,第三步所述的出行段,各出行段需满足:出行段长度大于400米,出行时间超过5分钟,否则该出行段并入上一出行段。
相比现有技术,本发明具有如下有益效果:
本发明有效剔除了出行端点识别与出行段合并中的噪声,算法简易、高效、识别结果精准、可靠。本发明可以丰富GPS轨迹数据挖掘算法体系,为大规模基于智能手机的出行调查推广提供理论支撑。
附图说明
图1一种基于GPS轨迹数据的出行段识别流程图
图2信号漂移点识别与删除
图3轨迹点速度计算示意图
图4出行段距离计算
具体实施方式
下面对本发明的实施例作详细说明,本实施例以本发明的技术方案为依据开展,给出了详细的实施方式和具体的操作过程。
一、数据清洗与预处理
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710537466.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:页面文件生成方法和装置
- 下一篇:跨网络结构化数据收集系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置