[发明专利]一种顾及位置重复和密度峰值点的签到位置数据聚类方法有效
申请号: | 201610707243.8 | 申请日: | 2016-08-23 |
公开(公告)号: | CN106326923B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | 邬群勇;刘萌 | 申请(专利权)人: | 福州大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 福州元创专利商标代理有限公司 35100 | 代理人: | 蔡学俊 |
地址: | 350108 福建省福州市*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 位置重复 峰值点 聚类 位置数据 构建 预处理 城市居民 活动变化 聚类过程 聚类结果 空间聚集 边界点 密度簇 新对象 截断 点选 连通 搜索 集合 邻近 筛选 统计 | ||
1.一种顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于,包括以下步骤:
步骤S1:从签到文本中提取出每条签到信息的编号以及经纬度信息构成原始签到对象,对所有的原始签到对象进行预处理后构成集合O;
步骤S2:统计集合O中每个位置上的原始签到对象的数量dFreq,以索引号、该位置坐标和dFreq构建对象FPi,将所有的FPi构成集合F,记F的总量为NF;
步骤S3:计算集合F中两两对象间的欧式距离并构成距离矩阵D,并根据D计算出截断距离dc,其中D=[dij],为NF×NF方阵,dij为第i个对象FPi与第j个对象FPj之间的欧氏距离, i,j∈1~NF,其中i≠j;
步骤S4:计算每个对象FPi的局部密度ρi和高密度最邻近距离δi;
步骤S5:求出阈值ρ0和δ0,选择集合F中ρi>ρ0且δi>δ0的对象为密度峰值对象,将所有的密度峰值对象构成集合P,余下的对象构成集合F’;
步骤S6:任取集合P中的某一密度峰值对象Pi,遍历集合F’,以指定搜索半径Eps为范围和密度大于ρt为条件搜索与密度峰值对象Pi连通的所有核心点,构成密度峰值对象Pi的核心点簇{C}i;
步骤S7:寻找密度峰值对象Pi和对应核心点周围所有的边界点,然后并入核心点簇{C}i构成密度峰值对象Pi的峰值点密度簇{P}i;
步骤S8: 重复步骤S6至S7直到集合P中的所有密度峰值对象Pi全部找完峰值点密度簇{P}i,获得最终聚类结果。
2.根据权利要求1所述的顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于:所述步骤S1中的预处理包括:
将原始签到对象的经纬度信息转换成墨卡托平面坐标;
以研究区范围的区划图作为底图,将原始签到对象与底图进行叠置,剔除研究区域以外的对象。
3.根据权利要求1所述的顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于: 所述步骤S3中截断距离dc的计算方法如下:
取距离矩阵D中上三角中的元素(不包含对角线元素)进行升序排序,取第 [(NF -1)*NF /2] *1%个元素作为截断距离dc。
4.根据权利要求1所述的顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于:所述步骤S4中对象FPi的局部密度ρi和高密度最邻近距离δi的计算方法如下:
其中,dij为对象FPi与FPj之间的欧氏距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610707243.8/1.html,转载请声明来源钻瓜专利网。