[发明专利]一种并行高效的基于网格与密度的多维空间数据聚类算法GRIDEN在审
申请号: | 201711063595.5 | 申请日: | 2017-11-02 |
公开(公告)号: | CN107908696A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 邓超;陈智斌;郭晓惠;农英雄;黄聪;李喆;韦屹;汪倍贝;钱方远 | 申请(专利权)人: | 广西中烟工业有限责任公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62 |
代理公司: | 北京三聚阳光知识产权代理有限公司11250 | 代理人: | 李红团 |
地址: | 530001 广西壮族*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 并行 高效 基于 网格 密度 多维 空间 数据 算法 griden | ||
1.一种基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,包括以下步骤:
步骤1,根据预设近邻距离参数ε、网格划分系数k及D维空间数据集P创建D维空间数据网格G,并将P中的数据点映射到G中;
步骤2,计算关于所述近邻距离参数ε与所述网格划分系数k的近邻格子子集S;
步骤3,根据预设最小近邻参数Min_N和所述近邻格子子集S对所述D维空间数据网格G进行无监督的空间网格聚类,并根据数据点所在D维格子的聚类结果对整个所述D维空间数据集P进行分类标注。
2.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,步骤一中,所述创建一个D维空间数据网格G,具体包括:
k为大于0的自然数;
ε为大于0的任意数值;
D为正整数;
计算每个格子的边长并根据所述边长L对所述D维空间数据集P的每个维度的数值范围进行平均切分;
所述空间数据网格G中的每个格子为各边相等的超方格子。
3.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,步骤1中,所述将P中的数据点映射到G中,具体包括:根据所述D维空间数据集P中每个点的D维信息将数据点映射到相应的格子,并进行累加与记录。
4.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,步骤2中,所述计算关于所述近邻距离参数ε与所述网格划分系数k的近邻格子子集S,具体包括:
对于所述D维空间数据网格G中的任意格子Ci,其所述近邻格子子集S中的任意格子Cj的正中心与Ci的正中心之间的空间距离不超过ε;
Ci也是Ci自己的近邻格子;
所述近邻格子子集S存在且仅存在于格子子集S1中,其中,S1是以Ci为空间正中心的(2k+1)D个格子的集合,且S1中的任意格子Cj与Ci在任意维度的间距均不超过k。
5.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,,其特征在于,步骤3中,所述的无监督的空间聚类具体包括以下步骤:
1)生成核心格子:对于所述D维空间数据网格G中的任意数据点数非空的格子Ci,计算其所述近邻格子子集S中的数据点数的总和,如果总数大于所述最小近邻参数Min_N,则Ci为核心格子,给予Ci独立的类标;
2)核心格子聚类:对于所述D维空间数据网格G中的任意核心格子Ci,将Ci与其所述近邻格子子集S中的所有其他核心格子合并到一个类中;迭代遍历G中的所有核心格子,并重复上述过程,直到合并不再发生;
3)格子聚类:对于所述D维空间数据网格G中的任意核心格子Ci,将Ci与其所述近邻格子子集S中的所有非空且非核心格子合并到一个类中,并标记为边界格子。
4)空间数据聚类:根据数据点所在D维格子的类标对整个所述D维空间数据集P进行分类标注。
6.根据权利要求1-3任一所述的基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,整个计算过程不存在计算依赖关系,可以支持并行计算。
7.根据权利要求1或4所述的基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,所述的无监督空间聚类计算过程需要按照4个步骤依次进行,但单个步骤中不存在计算依赖关系,可以支持并行计算。
8.一种执行基于网格与密度的多维空间数据聚类算法GRIDEN的电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
根据预设近邻距离参数ε、网格划分系数k及D维空间数据集P创建D维空间数据网格G,并将P中的数据点映射到G中;
计算关于所述近邻距离参数ε与所述网格划分系数k的近邻格子子集S;
根据预设最小近邻参数Min_N和所述近邻格子子集S对所述D维空间数据网格G进行无监督的空间网格聚类,并根据数据点所在D维格子的聚类结果对整个所述D维空间数据集P进行分类标注。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西中烟工业有限责任公司,未经广西中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711063595.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于无菌处理的装置
- 下一篇:等离子体喷射空气过滤和灭菌系统