[发明专利]特征化密度峰聚类的出租车热点区域提取方法有效

专利信息
申请号: 202010449285.2 申请日: 2020-05-25
公开(公告)号: CN111708853B 公开(公告)日: 2022-08-30
发明(设计)人: 汪小寒;罗永龙;张泽培;何增宇;胡王悟 申请(专利权)人: 安徽师范大学
主分类号: G06F16/29 分类号: G06F16/29;G06F16/28;G06F16/9537;G06K9/62;G06Q50/30
代理公司: 芜湖安汇知识产权代理有限公司 34107 代理人: 钟雪
地址: 241000 安徽省*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 特征 密度 峰聚类 出租车 热点 区域 提取 方法
【说明书】:

发明公开了一种特征化密度峰聚类的出租车热点区域提取方法,方法具体包括如下步骤:S1、选取一定数量的特征点放入特征点集合中,计算特征点集合中每个特征点的支持度;S2、计算密度峰聚类过程中的聚类指标,即特征点的局部密度和聚类中心距离,基于将特征化过程中得到的支持度结合聚类指标构建三维决策图;S3、基于三维决策图来选取聚类中心、基本聚类点以及噪声点;S4、基于聚类中心对基本聚类点进行聚类,形成聚类簇,一个聚类簇对应出租车的一个热点区域。基于特征化原理采用三维决策图来准确定位聚类中心、基本聚类点以及噪声点,由于采用特征点以及支持度模拟原始数据,进而提高了聚类效率,同时解决二维决策图无法处理重合点的问题。

技术领域

本发明属于数据聚类技术领域,提供了一种特征化密度峰聚类的出租车热点区域提取方法。

背景技术

聚类作为无监督机器学习方法已广泛应用于模式识别,图像分割,文档聚类等许多领域,其中DBSCAN和密度峰聚类等在识别目标数据集的高密度区域中起着重要作用,因此可以用于位置数据中的城市热点区域挖掘。但是出租车GPS位置数据的数据量大且存在稀疏点,如何避免噪声影响以及高效挖掘城市热点区域已成为急需解决的问题。针对现有密度峰聚类方法在处理大规模数据时,需要计算每两个位置点的距离矩阵,计算量巨大造成聚类低效,并且传统方法决策图无法识别重合点导致聚类结果不准确的问题。

发明内容

本发明提供了一种特征化密度峰聚类的出租车热点区域提取方法,旨在解决上述问题。

本发明是这样实现的,一种特征化密度峰聚类的出租车热点区域提取方法,所述方法具体包括如下步骤:

S1、GPS数据特征化:选取一定数量的特征点放入特征点集合中,计算特征点集合中每个特征点的支持度;

S2、计算密度峰聚类过程中的聚类指标,即特征点的局部密度和聚类中心距离,基于将特征化过程中得到的支持度结合聚类指标构建三维决策图;

S3、基于三维决策图来选取聚类中心、基本聚类点以及噪声点;

S4、基于聚类中心对基本聚类点进行聚类,形成聚类簇,一个聚类簇对应出租车的一个热点区域。

进一步的,特征点的选取方法具体如下:

根据特征化规模参数α及采样点个数Ts确定特征点个数;

从采样点中随机确定第1个临时特征点,将距第1个临时特征点距离最远的采样点作为第2个临时特征点,将距第2个临时特征点距离最远的采样点作为第3个临时特征点,以此类推,直至临时特征点数量满足特征点个数;

将原始数据集中所有采样点添加到距离他们最近的临时特征点集合中,并计算每个临时特征点集合中的采样点中心,将采样点中心更新为新的临时特征点,并重新将原始数据采样点添加到新的临时点特征集合中,再次计算每个新临时点集合中的采样点中心,迭代上述步骤,直到两次计算的采样点中心不变,则将临时特征点作为特征点输出。

进一步的,特征点对应临时特征点集合中的采样点个数,即为该特征点的支持度。

进一步的,特征点的局部密度获取过程具体如下:

计算该特征点到其他特征点的欧式距离,若该欧式距离小于截断距离,则该特征点的特征点局部密度自加1,遍历所有其他特征点,即生成该特征点的特征点局部密度。

进一步的,特征点的聚类中心距离获取方法具体如下:

循环遍历特征点集合,找到特征点集合中局部密度最大的特征点,该点的聚类中心距离是:该点到离他距离最远的特征点的欧式距离,对于其他特征点,聚类中心距离取离该点最近的特征点的欧式距离。

进一步的,三维决策图中X轴是特征点局部密度,Y轴表示特征点聚类中心距离,Z轴是特征点支持度,则聚类中心、基本聚类点及噪音点的选择方法具体如下:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010449285.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top