[发明专利]一种基于网格的聚类算法及其装置在审
申请号: | 201710977267.X | 申请日: | 2017-10-19 |
公开(公告)号: | CN107506802A | 公开(公告)日: | 2017-12-22 |
发明(设计)人: | 欧毓毅;牛少章 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 罗满 |
地址: | 510006 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网格 算法 及其 装置 | ||
1.一种基于网格的聚类算法,其特征在于,包括:
获取数据集,并根据数据集中数据的维度和数量划分多个网格;
将所述数据映射至对应的网格中;
选取密度最大的所述网格作为中心网格,将与所述中心网格相邻的,且满足密度要求的目标网格与所述中心网格合并以得到下一轮合并操作的所述中心网格,直到所述目标网格不存在为止;
判断所述中心网格是否存在边界点;
若存在,则将所述中心网格与所述边界点所在的边界网格合并;
若不存在,则根据所述中心网格输出数据簇或噪声集。
2.根据权利要求1所述的基于网格的聚类算法,其特征在于,所述选取密度最大的所述网格作为中心网格,将与所述中心网格相邻的,且满足密度要求的目标网格与所述中心网格合并以得到下一轮合并操作的所述中心网格,直到所述目标网格不存在为止具体包括:
选取密度最大的所述网格作为所述中心网格;
计算所述中心网格与所述中心网格的相邻网格的相对密度差,并将所述相对密度差小于预设值的所述相邻网格设置为所述目标网格;
将所述中心网格与所述目标网格合并,得到下一轮合并操作的所述中心网格;
判断是否存在所述目标网格;
若是,则继续将所述中心网格与所述目标网格合并,得到下一轮合并操作的所述中心网格;
若否,则结束进程。
3.根据权利要求1所述的基于网格的聚类算法,其特征在于,在所述将所述中心网格与所述边界点所在的边界网格合并之后进一步包括:
将所述边界网格进行标记。
4.根据权利要求2所述的基于网格的聚类算法,其特征在于,在所述将所述中心网格与所述目标网格合并之后进一步包括:
将所述目标网格进行标记。
5.根据权利要求3或4所述的基于网格的聚类算法,其特征在于,进一步包括:
在所述根据所述中心网格输出数据簇或噪声集之后判断多个所述网格中是否存在未被标记的所述网格,若是,则将未标记的所述网格中密度最大的所述网格设置为所述中心网格。
6.根据权利要求5所述的基于网格的聚类算法,其特征在于,进一步包括:
判断所述密度最大的所述网格的密度是否小于预设的最低网格密度;
若是,则将所述密度最大的所述网格进行标记。
7.根据权利要求1所述的基于网格的聚类算法,其特征在于,在所述根据合并的所述中心网格输出数据簇或噪声集之后进一步包括:
将所述数据簇设置为数据集,以便下一次根据数据集中的数据的维度和数量划分多个网格。
8.根据权利要求7所述的基于网格的聚类算法,其特征在于,进一步包括:
为所述数据簇分配独立的线程。
9.一种基于网格的聚类算法的装置,其特征在于,包括:
网格划分模块,用于获取数据集,并根据数据集中数据的维度和数量划分多个网格;
数据分箱模块,用于将所述数据映射至对应的网格中;
第一网格合并模块,用于选取密度最大的所述网格作为中心网格,将与所述中心网格相邻的,且满足密度要求的目标网格与所述中心网格合并以得到下一轮合并操作的所述中心网格,直到所述目标网格不存在为止;
第二网格合并模块,用于判断所述中心网格是否存在边界点;
若存在,则将所述中心网格与所述边界点所在的边界网格合并;
数据输出模块,用于当所述中心网格不存在边界点时,根据所述中心网格输出数据簇或噪声集。
10.一种基于网格的聚类算法的装置,其特征在于,包括:
存储器,用于存储计算机程序;
处理器,用于执行所述计算机程序以实现如权利要求1至8任一项所述基于网格的聚类算法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710977267.X/1.html,转载请声明来源钻瓜专利网。