[发明专利]数据聚簇方法、装置和计算机设备在审
申请号: | 202010269556.6 | 申请日: | 2020-04-08 |
公开(公告)号: | CN111598125A | 公开(公告)日: | 2020-08-28 |
发明(设计)人: | 陆杨;宋怀明;郭庆;张建磊;阮鹏飞 | 申请(专利权)人: | 中科曙光国际信息产业有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京康信知识产权代理有限责任公司 11240 | 代理人: | 李慧 |
地址: | 266100 山东省青岛市*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 方法 装置 计算机 设备 | ||
本发明公开了一种数据聚簇方法、装置和计算机设备。其中,数据聚簇方法包括:确定待聚簇数据所在的计算区域;将待聚簇数据所在的计算区域切割为多个子区域;依次计算出每个子区域内的待聚簇数据的第一聚簇结果;对相邻子区域的第一聚簇结果进行合并,并输出第二聚簇结果。本发明实施例的数据聚簇方法、装置和计算机设备,通过确定待聚簇数据所在的计算区域,并将待聚簇数据所在的计算区域切割为多个子区域,以及依次计算出每个子区域内的待聚簇数据的第一聚簇结果,然后对相邻子区域的第一聚簇结果进行合并,并输出第二聚簇结果,实现了对聚簇计算的优化,在对大数据进行处理时,能够有效提高计算效率,节省时间。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据聚簇方法、装置和计算机设备。
背景技术
聚类分析又称群分析,是研究(样品或指标)分类问题的一种统计分析方法,同时也是数据挖掘的一个重要算法。聚类分析是由若干模式组成的,通常情况下,模式是一个度量的向量或者是多维空间中的一个点。聚类分析以相似性为基础,在一个聚类中的模式之间比不在同一聚类中的模式之间具有更多的相似性。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)是一种基于密度的空间聚类算法。该算法将具有足够密度的区域划分为簇,并在具有噪声的空间数据库中发现任意形状的簇,它将簇定义为密度相连的点的最大集合。
在DBSCAN算法中将数据点分为三类,如图1所示:
核心点(Core point):若样本xi的ε邻域内至少包含了MinPts个样本,即Nε(Xi)≥MinPts,则称样本xi为核心点;
边界点(Border point):若样本xi的ε邻域内包含的样本数小于MinPts,但它在其他核心点的邻域内,则称样本xi为边界点;
噪点(Noise):既不属于核心点,也不属于边界点的点。
其中,ε为半径Eps,MinPts为预定样本数。
DBSCAN算法的问题在于算力有限,如果超过几十万的数据处理阈值,运算时间会成指数级上涨,运算完成时间不可期待,计算效率低。
发明内容
本发明的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本发明的第一个目的在于提出一种数据聚簇方法,能够实现对聚簇计算的优化,在对大数据进行处理时,能够有效提高计算效率,节省时间。
本发明的第二个目的在于提出一种数据聚簇装置。
本发明的第三个目的在于提出一种计算机设备。
本发明的第四个目的在于提出一种非临时性计算机可读存储介质。
为了实现上述目的,本发明第一方面实施例提出一种数据聚簇方法,该方法包括:
确定待聚簇数据所在的计算区域;
将所述待聚簇数据所在的计算区域切割为多个子区域;
依次计算出每个子区域内的待聚簇数据的第一聚簇结果;
对相邻子区域的第一聚簇结果进行合并,并输出第二聚簇结果。
可选的,确定待聚簇数据所在的计算区域,包括:
获取所有待聚簇数据的坐标信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科曙光国际信息产业有限公司,未经中科曙光国际信息产业有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010269556.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置