[发明专利]一种顾及位置重复和密度峰值点的签到位置数据聚类方法有效

专利信息
申请号: 201610707243.8 申请日: 2016-08-23
公开(公告)号: CN106326923B 公开(公告)日: 2019-03-12
发明(设计)人: 邬群勇;刘萌 申请(专利权)人: 福州大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 福州元创专利商标代理有限公司 35100 代理人: 蔡学俊
地址: 350108 福建省福州市*** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 位置重复 峰值点 聚类 位置数据 构建 预处理 城市居民 活动变化 聚类过程 聚类结果 空间聚集 边界点 密度簇 新对象 截断 点选 连通 搜索 集合 邻近 筛选 统计
【权利要求书】:

1.一种顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于,包括以下步骤:

步骤S1:从签到文本中提取出每条签到信息的编号以及经纬度信息构成原始签到对象,对所有的原始签到对象进行预处理后构成集合O;

步骤S2:统计集合O中每个位置上的原始签到对象的数量dFreq,以索引号、该位置坐标和dFreq构建对象FPi,将所有的FPi构成集合F,记F的总量为NF

步骤S3:计算集合F中两两对象间的欧式距离并构成距离矩阵D,并根据D计算出截断距离dc,其中D=[dij],为NF×NF方阵,dij为第i个对象FPi与第j个对象FPj之间的欧氏距离, i,j∈1~NF,其中i≠j;

步骤S4:计算每个对象FPi的局部密度ρi和高密度最邻近距离δi

步骤S5:求出阈值ρ0和δ0,选择集合F中ρi0且δi0的对象为密度峰值对象,将所有的密度峰值对象构成集合P,余下的对象构成集合F’;

步骤S6:任取集合P中的某一密度峰值对象Pi,遍历集合F’,以指定搜索半径Eps为范围和密度大于ρt为条件搜索与密度峰值对象Pi连通的所有核心点,构成密度峰值对象Pi的核心点簇{C}i

步骤S7:寻找密度峰值对象Pi和对应核心点周围所有的边界点,然后并入核心点簇{C}i构成密度峰值对象Pi的峰值点密度簇{P}i

步骤S8: 重复步骤S6至S7直到集合P中的所有密度峰值对象Pi全部找完峰值点密度簇{P}i,获得最终聚类结果。

2.根据权利要求1所述的顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于:所述步骤S1中的预处理包括:

将原始签到对象的经纬度信息转换成墨卡托平面坐标;

以研究区范围的区划图作为底图,将原始签到对象与底图进行叠置,剔除研究区域以外的对象。

3.根据权利要求1所述的顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于: 所述步骤S3中截断距离dc的计算方法如下:

取距离矩阵D中上三角中的元素(不包含对角线元素)进行升序排序,取第 [(NF -1)*NF /2] *1%个元素作为截断距离dc

4.根据权利要求1所述的顾及位置重复和密度峰值点的签到位置数据聚类方法,其特征在于:所述步骤S4中对象FPi的局部密度ρi和高密度最邻近距离δi的计算方法如下:

其中,dij为对象FPi与FPj之间的欧氏距离。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于福州大学,未经福州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201610707243.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top