[发明专利]一种基于集聚系数的自适应聚类方法及系统有效
申请号: | 201410512802.0 | 申请日: | 2014-09-29 |
公开(公告)号: | CN104281674B | 公开(公告)日: | 2017-07-11 |
发明(设计)人: | 蒋昌俊;陈闳中;闫春钢;丁志军;钟明洁;孙海春 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海光华专利事务所31219 | 代理人: | 余明伟 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于集聚系数的自适应聚类方法,包括根据已提取出的数据点对的属类和每次提取出的数据点间的关联关系的大小以确定数据点归于哪个属类,属类数目,建立数据点间的关联关系和属类间的关联关系;对每个属类进行预分割,计算两个子类的类内相似度和两个子类的类间相似度,判断预分割的两个子类是否满足分割条件,若是,则接收预分割;若否,则取消预分割;计算具有关联关系的两个属类的类内相似度和两个属类间的类间相似度,判断两个属类是否满足合并条件,若是,则合并两个属类生成新的属类;若否,则放弃合并。本发明首次将类中数据点两两之间的关系考虑进来,基于集聚系数计算类内相似程度和类间相似程度,使之更精确地集聚数据。 | ||
搜索关键词: | 一种 基于 集聚 系数 自适应 方法 系统 | ||
【主权项】:
一种基于集聚系数的自适应聚类方法,藉由多台服务器及客户端构建的计算机网络系统中,用于需要聚类的元素的集合,该集合中包括若干聚类对象集中的数据点,其特征在于,所述基于集聚系数的自适应聚类方法包括:初步聚类步骤,即获取若干聚类对象集中的数据点间的关联关系,获取适用于查找邻节点数目的最近邻算法中邻节点的数目以及通过曲线拟合技术获取所述数据点的分布曲线收敛速率;按照所述数据点间的关联关系的大小依次提取数据点对,根据已提取出的数据点对的属类和每次提取出的数据点间的关联关系的大小以确定所述数据点归于哪个属类,属类数目,并建立数据点间的关联关系和属类间的关联关系,直至处理完所有数据点以获取初步聚类结果;自学习聚类步骤,包括:分割步骤,即计算每个属类的类内相似度和计算每个属类中的数据点的局部集聚系数,将每个属类的类内相似度与每个属类中的数据点的局部集聚系数进行比较,按照将每个属类分割成数据点的局部集聚系数大于等于类内相似度和数据点的局部集聚系数小于类内相似度的两个子类的分割方式进行预分割,并计算两个子类的类内相似度和两个子类的类间相似度,判断预分割的两个子类是否满足分割条件,若是,则接收所述预分割,产生由多个属类组成的属类集合,并继续下一步步骤;若否,则取消所述预分割;查找步骤,在所述属类集合中查找具有关联关系的两个属类;合并步骤,即计算具有关联关系的两个属类的类内相似度和两个属类间的类间相似度,判断具有关联关系的两个属类是否满足合并条件,若是,则表示所述两个属类之间的关系密切,合并所述两个属类生成新的属类;若否,则表示所述两个属类之间的关系疏远,放弃合并。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410512802.0/,转载请声明来源钻瓜专利网。