[发明专利]基于地理位置的数据聚类挖掘系统及方法在审
申请号: | 201410116789.7 | 申请日: | 2014-03-26 |
公开(公告)号: | CN103927336A | 公开(公告)日: | 2014-07-16 |
发明(设计)人: | 冯志勇;张奇勋;赵小彤;张月 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 李迪 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 地理位置 数据 挖掘 系统 方法 | ||
技术领域
本发明涉及移动通信数据领域,具体涉及一种地理位置的数据聚类挖掘系统及方法。
背景技术
随着社会的不断发展、生活方式的改变、移动业务类型多样化和消费方式的改变,移动小区的网络质量也在不断变化。过去的网络配置在当前情况下并不适用,越来越多的地方出现了话务拥塞、通话质量差的问题。另一方面,城市功能区的明确也使得不同地区的消费方式、业务类型呈现出不同的特征。城市的功能分区一般包括住宅区、高校区、商业办公区、工业区和郊区等,虽然各功能分区之间没有明确的界限,但是每种都具有特定功能。
由于以往业务类型单一,对小区划分的方法多是基于某一业务特征的,如:话务量、话务拥塞率。使用以往的系统进行分析业务特征时,需要使用多种系统配合并进行多次划分。并且以前对小区划分的研究是将位置信息和属性信息分开的,要么只从地理上划分成小区块,要么按照某一业务特征分析用户的使用特性和业务量。同时,运营商需要从大量现有数据中挖掘出一些原先没有注意到的数据,而通常这需要配合几样系统来完成,并且效果一般。
现有数据挖掘系统,在进行数据处理时无法考虑其地理位置信息,特别针对移动运营商,地理位置信息已经成为一项非常重要的数据,而使用传统的系统很难将用户信息数据和用户地理位置数据进行结合考虑,缺乏一个可视化的效果。尤其是对于移动运营商在进行小区划分的问题上,无法将用户业务信息与用户地理信息结合起来考虑是一个很麻烦的问题,使用传统的方法,首先需要使用者熟练使用一个数据挖掘系统,以及数据处理系统,同时更重要的是一个地理位置信息系统,这之间的数据传递就是一个问题,无法配合地理位置信息观察数据挖掘结果更是使使用者缺乏对挖掘结果的直接感觉,往往会错过一些重要的结论。
发明内容
(一)要解决的技术问题
本发明要解决的技术问题是:将地理位置信息以及数据挖掘系统结合,使使用者可以更加清晰的从源数据中挖掘出一些有用的信息,针对移动运营商,可以更好的指导其进行小区划分方式。
(二)技术方案
为了解决上述技术问题,本发明提供一种基于地理位置的数据聚类挖掘方法,其特征在于,该方法包括:
选择待处理数据;
利用最优K值分析法对待处理数据进行最优K值选取;
利用选取的最优K值运用聚类算法对数据进行聚类分析;
将聚类分析结果与地理信息系统中的地理信息进行结合,并显示结合后的聚类结果。
优选的,所述聚类算法包括K-Means和K-Medoids两种聚类算法对导入的数据进行聚类分析。
一种基于地理位置的数据聚类挖掘系统,其特征在于,该系统包括:
数据库模块,用于导入待处理数据;
K值选取模块,用于根据所述待处理数据选取最优K值;
地理信息显示模块,将聚类分析结果与地理信息系统中的地理信息进行结合,并显示结合后的聚类结果。
优选的,所述聚类分析模块采用最优K值分析法进行最优K值的选取。
优选的,所述地理信息显示利用OpenMap工具包,对聚类分析结果进行地理位置信息的整合与输出。
优选的,所述系统还包括界面显示模块,用于显示数据库登陆界面、数据导入界面、聚类算法界面。
(三)有益效果
本发明的上述技术方案具有如下优点:利用最优K值选取算法可以分析得到最好的聚类数目,将优选的K值运用K-Means和K-Medoids两种聚类算法对导入的数据进行聚类分析,得到的聚类结果通过文件以及地理信息系统直观的得到显示,从而得到基于地理位置的聚类划分结果,供使用者进一步分析。
附图说明
图1为本发明实施例提供的一种基于地理位置的数据聚类挖掘系统结构示意图;
图2为本发明实施例提供的一种基于地理位置的数据聚类挖掘方法的步骤流程图;
具体实施方式
下面结合附图,对发明的具体实施方式作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案,而不能以此来限制本发明的保护范围。
如图2所示,本发明提供了一种基于地理位置的信息数据聚类挖掘方法,包括如下步骤:
选择待处理数据;
利用最优K值分析法对待处理数据进行最优K值选取;
利用选取的最优K值运用聚类算法对数据进行聚类分析;
将聚类分析结果与地理信息系统中的地理信息进行结合,并显示结合后的聚类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410116789.7/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置