[发明专利]一种基于集聚系数的自适应聚类方法及系统有效
申请号: | 201410512802.0 | 申请日: | 2014-09-29 |
公开(公告)号: | CN104281674B | 公开(公告)日: | 2017-07-11 |
发明(设计)人: | 蒋昌俊;陈闳中;闫春钢;丁志军;钟明洁;孙海春 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海光华专利事务所31219 | 代理人: | 余明伟 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集聚 系数 自适应 方法 系统 | ||
1.一种基于集聚系数的自适应聚类方法,藉由多台服务器及客户端构建的计算机网络系统中,用于需要聚类的元素的集合,该集合中包括若干聚类对象集中的数据点,其特征在于,所述基于集聚系数的自适应聚类方法包括:
初步聚类步骤,即获取若干聚类对象集中的数据点间的关联关系,获取适用于查找邻节点数目的最近邻算法中邻节点的数目以及通过曲线拟合技术获取所述数据点的分布曲线收敛速率;按照所述数据点间的关联关系的大小依次提取数据点对,根据已提取出的数据点对的属类和每次提取出的数据点间的关联关系的大小以确定所述数据点归于哪个属类,属类数目,并建立数据点间的关联关系和属类间的关联关系,直至处理完所有数据点以获取初步聚类结果;
自学习聚类步骤,包括:
分割步骤,即计算每个属类的类内相似度和计算每个属类中的数据点的局部集聚系数,将每个属类的类内相似度与每个属类中的数据点的局部集聚系数进行比较,按照将每个属类分割成数据点的局部集聚系数大于等于类内相似度和数据点的局部集聚系数小于类内相似度的两个子类的分割方式进行预分割,并计算两个子类的类内相似度和两个子类的类间相似度,判断预分割的两个子类是否满足分割条件,若是,则接收所述预分割,产生由多个属类组成的属类集合,并继续下一步步骤;若否,则取消所述预分割;
查找步骤,在所述属类集合中查找具有关联关系的两个属类;
合并步骤,即计算具有关联关系的两个属类的类内相似度和两个属类间的类间相似度,判断具有关联关系的两个属类是否满足合并条件,若是,则表示所述两个属类之间的关系密切,合并所述两个属类生成新的属类;若否,则表示所述两个属类之间的关系疏远,放弃合并。
2.根据权利要求1所述的基于集聚系数的自适应聚类方法,其特征在于:所述基于集聚系数的自适应聚类方法中初步聚类步骤还包括:
将若干聚类对象集中的数据点间的关联关系的分布信息进行统计,并根据统计的分布信息和采用所述曲线拟合技术获取关于若干聚类对象集中的数据点间的关联关系的曲线收敛速率;
根据所述查找邻节点数目的最近邻算法统计所述数据点间的邻节点数目的分布信息,获取邻节点数目的确定值,判断所述数据点拥有邻节点数目大于所述邻节点数目的确定值的数据点是否大于预定数量,若是,则继续执行按照所述数据点间的关联关系的大小依次提取数据点对步骤;若否,则结束进程。
3.根据权利要求1所述的基于集聚系数的自适应聚类方法,其特征在于:
在所述分割步骤中还包括更新所述两个子类与其它属类之间的类间关联关系,删除所述两个子类原所属属类与其它属类之间的类间关联关系;在所述合并步骤中还包括更新生成的新的属类与其它属类之间的类间关联关系,删除所述两个属类与其它属类之间的类间关联关系。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410512802.0/1.html,转载请声明来源钻瓜专利网。