[发明专利]一种预测目的地地址的方法及系统在审
申请号: | 201811454961.4 | 申请日: | 2018-11-30 |
公开(公告)号: | CN109636020A | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 宁春贵 | 申请(专利权)人: | 广州亚美信息科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06K9/62 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 杨立;黄启法 |
地址: | 510000 广东省广州市天河区翰*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目的地地址 预测 候选坐标 坐标数据 聚合 运算 分布式并行计算 海量用户 聚类运算 密度聚类 数据采用 终端设备 算法 并行 | ||
本发明公开一种预测目的地地址的方法及系统。该方法包括:由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据;将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据;将所述分别得到的运算后的目的地地址坐标数据进行汇总聚合,将汇总聚合后的目的地地址作为预测地址。本发明提供的方案,能更准确和快速地预测海量用户的目的地地址。
技术领域
本发明涉及车联网技术领域,具体涉及一种预测目的地地址的方法及系统。
背景技术
随着汽车技术和车联网技术的不断发展进步,车联网大数据的应用逐渐广泛。例如,可以根据大数据对车辆用户的家庭地址或公司地址等目的地地址进行预测。
目前对车辆用户的家庭地址或公司地址进行预测的方法,大部分是在单台PC环境下,基于用户常去地址的GPS(Global Positioning System,全球定位系统)坐标,使用K-Means(K均值)或KNN(K-NearestNeighbor,K最近邻)等算法进行聚类,然后将聚类后的结果作为用户可能的家庭地址或公司地址。其中,K-Means算法是一种典型的基于距离的聚类算法,采用距离作为相似性的评价指标,即认为两个对象的距离越近,其相似度就越大;而KNN算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。
但是,现有技术的目的地地址预测方法大多是针对少量用户的,例如通常是几千个以下用户,并且运行环境为单台PC,使用的聚类算法时间复杂度也较高,随数据的增长所需的运行时长也成倍增长,从而导致对百万及以上的用户数量就无能为力,另外还有预测算法耗时较长、预测结果准确度不高等缺点。
发明内容
有鉴于此,本发明的目的在于提出一种预测目的地地址的方法及系统,能更准确和快速地预测海量用户的目的地地址。
根据本发明的一个方面,提供一种预测目的地地址的方法,包括:
由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据;
将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据;
将所述分别得到的运算后的目的地地址坐标数据进行汇总聚合,将汇总聚合后的目的地地址作为预测地址。
优选的,所述由分布式并行计算框架下的不同终端设备获取被拆分后的目的地地址候选坐标数据之前,还包括:
将用户设定时间段内的行程记录数据进行预处理,得到目的地地址候选坐标数据。
优选的,所述将用户设定时间段内的行程记录数据进行预处理,得到目的地地址候选坐标数据,包括:
将用户设定时间段内的行程记录数据中的目的地地址坐标,聚合到候选坐标表的同一行作为目的地地址候选坐标数据。
优选的,所述将用户设定时间段内的行程记录数据中的目的地地址坐标,聚合到候选坐标表的同一行作为目的地地址候选坐标数据,包括:
将用户设定时间段内的行程记录数据中,选取设定时间点内的第一次停车和最后一次停车的地址坐标数据,分别作为公司地址候选坐标数据及家庭地址候选坐标数据,将所述选取的公司地址候选坐标数据及家庭地址候选坐标数据分别聚合到候选坐标表的同一行。
优选的,所述将所述获取的目的地地址候选坐标数据采用密度聚类算法并行进行聚类运算,分别得到运算后的目的地地址坐标数据,包括:
遍历所述候选坐标表的每行目的地地址候选坐标数据;
采用密度聚类算法判断所述目的地地址候选坐标中的核心点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广州亚美信息科技有限公司,未经广州亚美信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811454961.4/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理