[发明专利]基于Meanshift和K-means聚类的社交网络用户位置特征提取方法和装置有效
申请号: | 201910628876.3 | 申请日: | 2019-07-12 |
公开(公告)号: | CN112287247B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 史英吉;王海艳;吕朝萍;何旭 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/9537 | 分类号: | G06F16/9537;G06F16/9536;G06F16/29;G06K9/62;G06Q50/00 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 朱远枫 |
地址: | 210012 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 meanshift means 社交 网络 用户 位置 特征 提取 方法 装置 | ||
本发明公开了基于Meanshift和K‑means算法的社交网络用户位置特征提取方法和装置,该方法用于解决在海量的用户签到数据中发现用户签到频次中较高的热点区域,即用户真正感兴趣的位置,本发明的实施流程包括:首先对从Flickr平台收集到的用户签到数据进行分析和预处理,选取一个签到点较为密集且比较典型的区域作为研究区域,而后基于Meanshift方法对某个城市范围的签到数据进行初步聚类,并对筛选出规模较大的簇和过于密集的簇基于K‑means方法进行二次聚类,最后根据分簇结果划分到对应兴趣点(POI),即完成用户位置特征提取。采用本发明的方法,可以更有效地实现对于LBSNs数据的位置特征提取。
技术领域
本发明属于智能信息处理和数据挖掘领域,具体涉及基于位置的移动社交网络(Location-based social networks,LBSNs)中海量用户签到数据的应用和挖掘,尤其涉及一种基于Meanshift和K-means集成聚类算法的社交网络用户位置特征提取方法和装置。
背景技术
移动互联网(Mobile Internet)和全球定位系统(Global Positioning System,GPS)技术的进步带动了基于位置的移动社交网络(Location-based social networks,LBSNs)的快速发展,因此积累了海量的签到数据。LBSNs的快速发展提供了丰富的信息,极大地丰富了人类移动数据的可用性,带来了多方面的价值,一方面,与传统的社交网络数据相比,LBSNs数据除了包含社交关系数据和评论数据外,还包含了用户的位置信息。这使得网络社交从单纯的网络虚拟世界交流到现实世界的时空属性有了联系。另一个方面,与传统的GPS数据相比,LBSNs数据除了位置数据外,包含了社交关系和评论数据。这使得从地理学角度出发的分析不再仅仅局限于单一的时空位置分析,而可以结合用户活动的规律性和目的性,得到更多更有实际意义的行为模式。LBSNs数据中隐藏了大量的用户活动特征和行为模式,因此对LBSNs数据的特征提取工作成为了热门的研究问题。从中发现对用户出行和城市发展的价值,对进一步提升基于位置的服务质量有重要意义。
一般方法通过对LBSNs中的签到点进行聚类,发现作为访问热点的POI(Point ofInterest)(用户签到频次较高的热点区域),从而提取出用户的位置特征。由于缺少对聚类算法在LBSNs数据上的适应性的认知,尽管诸多研究人员在提取POI的工作中直接应用或者有针对性地改良聚类算法,但是在哪种聚类算法最适合LBSNs数据方面,通常是以单一算法去适应LBSNs数据的多种特性需求,难以做到兼顾。因而需要针对LBSNs数据量大和密度不均匀等多种特点设计算法,实现更加有效的位置特征提取。
发明内容
本发明的目的在于解决采用单一算法不能适应LBSNs数据量大和密度不均匀的问题,提出一种基于Meanshift和K-means集成聚类算法的社交网络用户位置特征提取方法,实现更加有效地LBSNs用户位置特征提取。
根据LBSNs数据的特点,所设计的方法满足以下三个标准:
A.能够识别多密度聚类;
B.能够处理任意形状的聚类;
C.能够有尽可能低的时空间复杂度。
为实现上述技术目的,本发明所采用的技术方案为:
提出一种基于Meanshift和K-means集成聚类算法的社交网络用户位置特征提取方法所采用的技术方案具体包括如下步骤:
根据预先收集的用户签到数据选定对象区域,获取所述对象区域的用户签到数据;提取其中的用户地理位置信息数据,对其进行数据预处理;
基于Meanshift方法对选定范围内的用户地理位置信息数据进行初步聚类;
按照预设条件筛选出特定的簇并基于K-means方法进行二次聚类;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910628876.3/2.html,转载请声明来源钻瓜专利网。