[发明专利]一种并行高效的基于网格与密度的多维空间数据聚类算法GRIDEN在审

专利信息
申请号: 201711063595.5 申请日: 2017-11-02
公开(公告)号: CN107908696A 公开(公告)日: 2018-04-13
发明(设计)人: 邓超;陈智斌;郭晓惠;农英雄;黄聪;李喆;韦屹;汪倍贝;钱方远 申请(专利权)人: 广西中烟工业有限责任公司
主分类号: G06F17/30 分类号: G06F17/30;G06K9/62
代理公司: 北京三聚阳光知识产权代理有限公司11250 代理人: 李红团
地址: 530001 广西壮族*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 并行 高效 基于 网格 密度 多维 空间 数据 算法 griden
【权利要求书】:

1.一种基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,包括以下步骤:

步骤1,根据预设近邻距离参数ε、网格划分系数k及D维空间数据集P创建D维空间数据网格G,并将P中的数据点映射到G中;

步骤2,计算关于所述近邻距离参数ε与所述网格划分系数k的近邻格子子集S;

步骤3,根据预设最小近邻参数Min_N和所述近邻格子子集S对所述D维空间数据网格G进行无监督的空间网格聚类,并根据数据点所在D维格子的聚类结果对整个所述D维空间数据集P进行分类标注。

2.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,步骤一中,所述创建一个D维空间数据网格G,具体包括:

k为大于0的自然数;

ε为大于0的任意数值;

D为正整数;

计算每个格子的边长并根据所述边长L对所述D维空间数据集P的每个维度的数值范围进行平均切分;

所述空间数据网格G中的每个格子为各边相等的超方格子。

3.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,步骤1中,所述将P中的数据点映射到G中,具体包括:根据所述D维空间数据集P中每个点的D维信息将数据点映射到相应的格子,并进行累加与记录。

4.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,步骤2中,所述计算关于所述近邻距离参数ε与所述网格划分系数k的近邻格子子集S,具体包括:

对于所述D维空间数据网格G中的任意格子Ci,其所述近邻格子子集S中的任意格子Cj的正中心与Ci的正中心之间的空间距离不超过ε;

Ci也是Ci自己的近邻格子;

所述近邻格子子集S存在且仅存在于格子子集S1中,其中,S1是以Ci为空间正中心的(2k+1)D个格子的集合,且S1中的任意格子Cj与Ci在任意维度的间距均不超过k。

5.根据权利要求1所述基于网格与密度的多维空间数据聚类算法GRIDEN,,其特征在于,步骤3中,所述的无监督的空间聚类具体包括以下步骤:

1)生成核心格子:对于所述D维空间数据网格G中的任意数据点数非空的格子Ci,计算其所述近邻格子子集S中的数据点数的总和,如果总数大于所述最小近邻参数Min_N,则Ci为核心格子,给予Ci独立的类标;

2)核心格子聚类:对于所述D维空间数据网格G中的任意核心格子Ci,将Ci与其所述近邻格子子集S中的所有其他核心格子合并到一个类中;迭代遍历G中的所有核心格子,并重复上述过程,直到合并不再发生;

3)格子聚类:对于所述D维空间数据网格G中的任意核心格子Ci,将Ci与其所述近邻格子子集S中的所有非空且非核心格子合并到一个类中,并标记为边界格子。

4)空间数据聚类:根据数据点所在D维格子的类标对整个所述D维空间数据集P进行分类标注。

6.根据权利要求1-3任一所述的基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,整个计算过程不存在计算依赖关系,可以支持并行计算。

7.根据权利要求1或4所述的基于网格与密度的多维空间数据聚类算法GRIDEN,其特征在于,所述的无监督空间聚类计算过程需要按照4个步骤依次进行,但单个步骤中不存在计算依赖关系,可以支持并行计算。

8.一种执行基于网格与密度的多维空间数据聚类算法GRIDEN的电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:

根据预设近邻距离参数ε、网格划分系数k及D维空间数据集P创建D维空间数据网格G,并将P中的数据点映射到G中;

计算关于所述近邻距离参数ε与所述网格划分系数k的近邻格子子集S;

根据预设最小近邻参数Min_N和所述近邻格子子集S对所述D维空间数据网格G进行无监督的空间网格聚类,并根据数据点所在D维格子的聚类结果对整个所述D维空间数据集P进行分类标注。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西中烟工业有限责任公司,未经广西中烟工业有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711063595.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top