[发明专利]一种计算车辆起始地和目的地的方法有效
申请号: | 201510013434.X | 申请日: | 2015-01-12 |
公开(公告)号: | CN104615858B | 公开(公告)日: | 2018-01-09 |
发明(设计)人: | 李鹏 | 申请(专利权)人: | 北京中交兴路车联网科技有限公司 |
主分类号: | G06F17/18 | 分类号: | G06F17/18 |
代理公司: | 北京和信华成知识产权代理事务所(普通合伙)11390 | 代理人: | 胡剑辉 |
地址: | 101111 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 计算 车辆 起始 目的地 方法 | ||
技术领域
本发明涉及大规模数据处理的技术领域,具体地涉及一种计算车辆起始地和目的地的方法。
背景技术
车辆在行驶的过程中,会通过车载终端间隔地向后台服务器传输行驶记录数据。如何更准确地从这些行驶记录数据中分析出哪些是车辆的起始地,哪些是车辆行驶的目的地,将能开发出更多基于此数据的新应用。
通常计算车辆起始地和目的地的方法是将所有车辆经过的每个城市分别划分为起始地和目的地进行计算。这样就将很多车辆途经的城市也划分为起始地或者目的地了。这种方法计算量大,不利于数据查询,计算结果模糊,且没有将普通停靠点从起始地和目的地中区分开来。
发明内容
本发明的技术解决问题是:克服现有技术的不足,提供一种计算车辆起始地和目的地的方法,其计算量小,有利于数据查询,计算结果较为准确。
本发明的技术解决方案是:这种计算车辆起始地和目的地的方法,该方法包括以下步骤:
(1)将车辆行驶轨迹数据网格化;
(2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出停靠时间排序前50的停靠点;
(3)获取每个车辆的停靠时间排序前50的停靠点的原始数据;
(4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
(5)进行停靠点特征提取;
(6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
(7)找出每个特征中的最大值。
本发明提取车辆每次停靠的多种特征,标注数据,利用机器学习的方法分析每一次停靠地是不是起始地或者目的地,使得计算量小,有利于数据查询,计算结果较为准确。
附图说明
图1为根据本发明的数据网格化的示意图。
图2为根据本发明的计算车辆起始地和目的地的方法的流程图。
具体实施方式
如图2所示,这种计算车辆起始地和目的地的方法,该方法包括以下步骤:
(1)将车辆行驶轨迹数据网格化;
(2)计算每个车辆经过一个网格一次在该网格内的停留时间;通过过滤操作过滤掉总停留时间小于指定时间的停靠点;对于每个车辆,按照在每个停靠点的总停靠时间从大到小排序,并找出排序前50的停靠点;
(3)获取每个车辆的排序前50的停靠点的原始数据;
(4)对货车轨迹的停靠点进行聚类,对聚类之后的簇是否特殊进行特征标注,根据前50个停靠点是否在特殊簇进行特征标注;
(5)进行停靠点特征提取;
(6)根据步骤(5)的特征,通过货车停靠的数据与实际地图进行比较,标注出货车的起始地和目的地,形成标注集;
(7)找出每个特征中的最大值。
本发明提取车辆每次停靠的多种特征,标注数据,利用机器学习的方法分析每一次停靠地是不是起始地或者目的地,使得计算量小,有利于数据查询,计算结果较为准确。
另外,所述步骤(7)中对每个特征做归一化处理,并且该方法还包括以下步骤:
(8)根据提取特征的停靠点数据,对其进行逻辑回归建模;
(9)对计算结果,运用交叉验证,计算模型的精度、召回率。
另外,所述步骤(1)包括以下分步骤:
(1.1)数据过滤,将时间大于2020年或者小于2010年的数据过滤掉;将经度为0或者纬度为0的数据过滤掉;将行驶里程为0的数据过滤掉;
(1.2)对于数据的经纬度做网格化处理,将数据的经纬度的最后两位数字改写为50,这样当两个数据的经纬度坐标除了最后两位之外都相同时,这两个数据的经纬度处于同一个网格中;
(1.3)对于每个车辆,按照车辆行驶轨迹数据的记录时间排序之后,计算当前时间跟上一条时间的间隔,并添加在该行驶轨迹数据末尾。
另外,所述步骤(2)中停留时间为当前网格的最后记录点时间减去前一网格的最先记录点时间,指定时间为10分钟。
另外,所述步骤(3)通过连接join操作获取每个车辆的排序前50的停靠点的原始数据。
另外,所述步骤(4)对前50的停靠点的原始数据和聚类后的停靠点做join操作,以便连接上前50的停靠点的原始数据中的时间和在每个停靠点的间隔,按照停靠时间对聚类后的停靠点做排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京中交兴路车联网科技有限公司,未经北京中交兴路车联网科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510013434.X/2.html,转载请声明来源钻瓜专利网。