[发明专利]一种海量数据聚类分析方法及装置在审
申请号: | 201911270066.1 | 申请日: | 2019-12-12 |
公开(公告)号: | CN110717086A | 公开(公告)日: | 2020-01-21 |
发明(设计)人: | 查文宇;曾理;徐浩;王纯斌;赵神州;张艳清 | 申请(专利权)人: | 成都四方伟业软件股份有限公司 |
主分类号: | G06F16/906 | 分类号: | G06F16/906;G06F16/901 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种海量数据聚类分析方法及装置,本发明的目的在于实现一种基于并行计算的DBSCAN算法,解决传统密度聚类算法无法进行海量数据分析的问题。该发明提出了高效的交叠分区和类簇合并策略,能够快速的进行数据拆分和类簇合并,并且该方法充分考虑了负载均衡,可以在分布式框架下实现高效运算,从而支持海量数据的聚类,高效地解决了传统DBSCAN无法进行海量数据分析的问题,因此该方法具有较高的性能和实用价值。 | ||
搜索关键词: | 海量数据分析 海量数据 类簇 算法 分布式框架 并行计算 负载均衡 交叠分区 聚类分析 密度聚类 合并 聚类 运算 | ||
【主权项】:
1.一种海量数据聚类分析方法,其特征在于:包括以下步骤:/nS1、基于交叠分区的GeoHash编码算法对原始数据进行处理,确定原始数据中的各个数据对应的分区;/nS2、在每个分区内对分区内的数据并行进行聚类,并保存聚类ID;/nS3、将分区结果进行合并得到全局的类簇ID。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都四方伟业软件股份有限公司,未经成都四方伟业软件股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911270066.1/,转载请声明来源钻瓜专利网。