[发明专利]一种自适应聚类方法在审
申请号: | 201510898107.7 | 申请日: | 2015-12-07 |
公开(公告)号: | CN105550244A | 公开(公告)日: | 2016-05-04 |
发明(设计)人: | 王晓密;刘耀林;刘殿峰;赵翔;刘艳芳 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 魏波 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 方法 | ||
技术领域
本发明属于空间数据挖掘与空间分析技术领域,尤其涉及一种改进的自适应 聚类方法。
背景技术
空间数据挖掘作为近年来从大量复杂数据库中发现有用信息和知识的有力 工具得到广泛的关注。空间聚类作为空间数据挖掘的一个主要研究方向,旨在是 用相似性尺度来衡量事物之间的亲疏程度,并以此来实现分类。目前已广泛应用 于分等定级、影像分类、异常探测、热点分析等诸多领域。
已有的空间聚类方法大概可分为:(1)基于密度的方法;(2)基于划分的 方法;(3)基于层次的方法;(4)基于模型的方法;(6)基于格网的方法。
已有的空间聚类算法很难顾全以下几种聚类要求:(1)顾及空间簇内目标 的邻近性;(2)顾及空间障碍的影响;(3)顾及噪声点的影响;(4)顾及空 间分布的密度差异;(5)实现任意形状的空间簇的识别;(5)实现自适应的空 间聚类。因此需要一种改进的空间聚类方法满足不断增长的聚类需求。
已有的顾及空间和非空间属性的双重聚类大多将目标之间的距离定义为空 间属性与非空间属性进行归一化后加权求和的值,再采用已有的空间聚类方法实 现聚类操作,该方法中空间属性与非空间属性的权重难以确定。也有部分聚类方 法从空间属性聚类和非空间属性聚类两方面展开,但已有方法难以自适应的实现 聚类操作,通常需要人为的设定参数,且对聚类结果的优劣没有很好的评判标准, 在没有足够先验知识的前提下,难以明确最优参数值。此外,现有方法通常没有 顾及噪声和空间障碍的影响。
因此随着当前聚类需求的不断增长,迫切需要一种改进的自适应聚类算法实 现空间属性与非空间属性的双重聚类。
发明内容
为了解决上述问题,本发明提供了一种可以实现空间属性与非空间属性的双 重聚类的自适应聚类方法。
本发明所采用的技术方案是:一种自适应聚类方法,其特征在于,包括以下 步骤:
步骤1:收集处理研究区数据集并明确聚类目标;
若是对数据集的空间属性进行聚类,则顺序执行下述步骤2、步骤4和步骤 5;
若是对数据集的空间属性与非空间属性进行聚类,则顺序执行下述步骤2、 步骤3、步骤4和步骤5;
步骤2:对数据集的空间属性进行聚类;
分析数据集的空间属性,将空间属性相近的目标聚集成簇,实现空间相邻, 且空间分布密度相似的目标聚集成簇;
步骤3:对数据集的非空间属性进行聚类;
在步骤2的基础上,分析每个簇的非空间属性分布,进一步将非空间属性相 近的目标聚集成簇;
步骤4:对已有的聚类结果进行优化,将与邻近簇属性相近的噪声和较小簇 归并到邻近簇内;
步骤5:聚类结果输出。
作为优选,步骤1所述的收集处理研究区数据集,其中对数据集进行处理的 方法主要包括采用空间插值方法实现空缺数据的修补、对重复的数据进行删除和 在涉及非空间属性聚类时对用于聚类分析的非空间属性进行选取。
作为优选,步骤2的具体实现包括以下子步骤:
步骤2.1:初始化调节参数β;
步骤2.2:构建Delaunay三角网G确定目标间的邻近关系,若存在空间障碍 的影响,则打断与空间障碍相交的Delaunay三角网边;
步骤2.3:删除整体上过长的Delaunay三角网边,整体约束条件表达式为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510898107.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图片播放方法和装置
- 下一篇:一种分布式文本检测方法及系统