[发明专利]一种顾及位置重复和密度峰值点的签到位置数据聚类方法有效
申请号: | 201610707243.8 | 申请日: | 2016-08-23 |
公开(公告)号: | CN106326923B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 邬群勇;刘萌 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及了一种顾及位置重复和密度峰值点的签到位置数据聚类方法,包括以下步骤:1.构建原始签到对象并进行预处理;2.统计每个位置上原始签到对象数量以此构建新对象FPi并构成集合F;3.计算截断距离dc;4.计算每个FPi的局部密度ρi和高密度最邻近距离δi;5.计算阈值ρ0和δ0并筛选出密度峰值点;6.获取与每个峰值点密度连通的核心点簇;7.搜索每个核心点簇的边界点添加到核心点簇中构成峰值密度簇,完成全部聚类过程。本发明充分考虑了签到位置重复的问题,有效避免了位置重复数量较高的离群点选为峰值并聚类的情况,聚类结果更加准确可靠,可以更好地反映城市居民空间聚集和活动变化情况,具有较高的实用价值。 | ||
搜索关键词: | 位置重复 峰值点 聚类 位置数据 构建 预处理 城市居民 活动变化 聚类过程 聚类结果 空间聚集 边界点 密度簇 新对象 截断 点选 连通 搜索 集合 邻近 筛选 统计 | ||
【主权项】:
1.一种顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于,包括以下步骤:步骤S1:从签到文本中提取出每条签到信息的编号以及经纬度信息构成原始签到对象,对所有的原始签到对象进行预处理后构成集合O;步骤S2:统计集合O中每个位置上的原始签到对象的数量dFreq,以索引号、该位置坐标和dFreq构建对象FPi,将所有的FPi构成集合F,记F的总量为NF;步骤S3:计算集合F中两两对象间的欧式距离并构成距离矩阵D,并根据D计算出截断距离dc,其中D=[dij],为NF×NF方阵,dij为第i个对象FPi与第j个对象FPj之间的欧氏距离, i,j∈1~NF,其中i≠j;步骤S4:计算每个对象FPi的局部密度ρi和高密度最邻近距离δi;步骤S5:求出阈值ρ0和δ0,选择集合F中ρi>ρ0且δi>δ0的对象为密度峰值对象,将所有的密度峰值对象构成集合P,余下的对象构成集合F’;步骤S6:任取集合P中的某一密度峰值对象Pi,遍历集合F’,以指定搜索半径Eps为范围和密度大于ρt为条件搜索与密度峰值对象Pi连通的所有核心点,构成密度峰值对象Pi的核心点簇{C}i;步骤S7:寻找密度峰值对象Pi和对应核心点周围所有的边界点,然后并入核心点簇{C}i构成密度峰值对象Pi的峰值点密度簇{P}i;步骤S8: 重复步骤S6至S7直到集合P中的所有密度峰值对象Pi全部找完峰值点密度簇{P}i,获得最终聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610707243.8/,转载请声明来源钻瓜专利网。