[发明专利]一种基于粗糙集和粒子群算法的改进模糊C‑均值聚类算法在审

专利信息
申请号: 201710381950.7 申请日: 2017-05-26
公开(公告)号: CN107169522A 公开(公告)日: 2017-09-15
发明(设计)人: 张剑;徐立云;朱芳来;张苗苗;王云倩 申请(专利权)人: 同济大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 上海正旦专利代理有限公司31200 代理人: 张磊
地址: 200092 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 粗糙 粒子 算法 改进 模糊 均值
【说明书】:

技术领域

发明属于聚类算法领域,具体涉及一种基于粗糙集和粒子群算法的改进模糊C-均值聚类算法。

背景技术

聚类是将一个同类对象组群划分为子集的过程,每个子集称为一个簇,同一个簇中的对象之间具有较高的相似度,不同簇中的对象差别较大。聚类技术已被广泛应用于数据挖掘,模式识别和机器学习。为处理这些随机分布的数据集,将软计算中引入了聚类,它利用不精确性和不确定性实现算法的可追踪性和鲁棒性,相应的模糊集和粗糙集也被引入到C均值体系中并衍生出模糊C均值(FCM)和粗糙C均值(RCM)算法。

模糊算法可以将数据对象分配到多个聚类并处理重叠聚类。模糊聚类中隶属度取决于数据对象对聚类中心的贴近度。最流行的模糊聚类算法是由Bezdek提出的FCM,现仍广泛使用。FCM是一种有效的算法,但其中心点的随机选择使迭代过程容易陷入鞍点或者局部最优解。此外,如果数据集包含严重的噪声点,或如果数据集是高维的,交替优化往往无法找到全局最优解。在这种情况下,通过采用随机的方法就可以提高找到全局最优的概率。为了克服FCM的缺点,粗糙集的概念被引入算法,通过消除对聚类结构带来负面影响的坏点来提高新原型的迭代效率,与FCM相比,粗糙C均值算法处理类簇边缘数据的能力有所提高;而为了解决FCM早熟的问题,粒子群算法(PSO)也被引入,利用其全局搜索能力寻找更为合适的聚类中心。

此外,虽然已有较多基于FCM、PSO或粗糙集的聚类算法,但是这些算法大多需要输入预估聚类的数目C。在一个给定的数据集合中为获得理想的聚类结果,通常需要手动设置 C的值,但这是一个非常主观和随意的过程。因此,我们希望找到在给定聚类数量范围内C 的最佳取值,通过考虑簇内紧凑性、簇间分散性以及降低对初始值的敏感程度,以便获得合理的聚类分割。本发明提出了一种改进的算法RP-FCM,它集成了PSO算法的优点,迭代时运用了粗糙集的特性,并可以快速地自动估计最佳聚类数目。

发明内容

本发明的目的在于提供一种基于粗糙集和粒子群算法的改进模糊C-均值聚类算法,本发明利用粒子群优化算法的全局搜索能力来克服传统模糊聚类的过早收敛问题,利用粗糙集模糊平衡属性来处理类簇间的重叠以及类簇边界的模型不确定性,利用DB指数评价聚类的有效性,在给定的类簇数量范围内自动寻找最优聚类数目,以提供紧凑且良好分隔的类簇。

本发明提出的一种基于粗糙集和粒子群算法的改进模糊C-均值聚类算法,具体步骤如下:

(1)初始化设定参数:给定聚类数量范围[Cmin,Cmax],令初始聚类数量C=Cmax,选取两个计数器,第一计数器的叠代次数k,第二计数器的叠代次数t,PSO的最大迭代次数T;

(2)初始化设定参数:根据PSO,给定粒子数量L,粒子最初速度V,粒子最初位置P,第一计数器的加速系数c1,第二计数器的加速系数c2,惯性常数w,聚类基数阈值ε和损耗率ρ;

(3)初始化设定参数:设定模糊集上近似的权重ωup,下近似的权重ωlow,且ωuplow=1,模糊隶属度的加权指数m,阈值σ;

(4)根据步骤(1)-步骤(3)设定的参数,选取第二计数器,通过计算划分矩阵、聚类中心、适应度值、个体极值、全局极值,以及更新每个粒子的速度和位置,重复步骤 (4.1)-(4.7)看其是否达到PSO算法的终止条件;

(4.1)计算所有待分类粒子的划分矩阵U(k);

U=[uij]N×C为隶属度矩阵,

其中:uij∈[0,1]表示数据对象xi关于聚类βj的隶属程度,xij∈RV,V是数据的维数,1≤i≤N和1≤j≤C,dij=d(xij)是数据向量xi到聚类中心βj的欧氏距离即 dij=||xij||;

(4.2)计算所有待分类粒子的聚类中心:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710381950.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top