[发明专利]基于模糊C-均值算法和人工蜂群聚类算法的混合聚类算法在审
申请号: | 201810935647.1 | 申请日: | 2018-08-16 |
公开(公告)号: | CN109086831A | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 李宏伟;卫建华;田智慧;赫晓慧;郭恒亮;王晓蕾;赵姗 | 申请(专利权)人: | 李宏伟 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 郑州先风专利代理有限公司 41127 | 代理人: | 王俊红 |
地址: | 450000 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 聚类算法 最优解 模糊C -均值算法 算法 蜂群 优化 初始聚类中心 均值聚类算法 人工蜂群算法 初始化阶段 模糊 均值算法 次循环 引领蜂 准确率 迭代 聚类 寻优 收敛 放弃 | ||
本发明涉及人工蜂群算法技术领域,具体涉及基于模糊C‑均值算法和人工蜂群聚类算法的混合聚类算法,该算法包括初始化阶段、引领蜂阶段、跟随蜂阶段和侦查蜂阶段,还包括如下步骤:步骤一:跟随蜂阶段结束后,判断当前算法是否是第一次循环;若是,则执行步骤二;若不是,则执行步骤三;步骤二:将当前的最优解作为模糊C‑均值聚类算法的初始聚类中心进行优化,若优化后的解的质量高于当前最优解,则用优化后的解代替当前最优解,否则放弃,同时相应蜜源的迭代次数加1,然后进入侦查蜂阶段;步骤三:判断最优解在跟随蜂阶段后是否发生改变;若是,则执行步骤二;若否,则进入侦查蜂阶段。本发明所提供的算法聚类准确率高、收敛速度快、寻优精度高。
技术领域
本发明涉及人工蜂群算法技术领域,具体涉及一种基于模糊C-均值算法和人工蜂群聚类算法的混合聚类算法。
背景技术
关于模糊C-均值算法:
1974年Dunn在Bezdek的研究基础上提出模糊C-均值(FCM)聚类算法,被广泛应用于地理空间信息、图像处理、数据挖掘等多个领域。模糊C-均值算法和硬C-均值算法的最大不同之处在于对象的隶属度问题,硬C-均值要求对象的隶属度只能是0,1两个值,而模糊C-均值允许对象的隶属度在[0,1]之间,也可以取0或1,模糊C-均值的这种特点使得对象拥有更大的灵活性,一个对象既可以属于C1也可以属于C2类,只是隶属程度不同而已。
模糊C-均值聚类算法的基本过程是:首先对数据集中对象的分布特点进行分析,根据对象的分布特点设定合适的聚类数目c和模糊指数m;然后从数据集中随机选择c个对象作为初始聚类中心;接下来进行循环迭代,得到划分矩阵,划分矩阵包含着各个对象对所有类的隶属度信息,通过划分矩阵和数据集确定新一代聚类中心;最后,当目标函数收敛达到收敛精度或者对象的隶属度保持稳定时,停止迭代,得到最终聚类中心,数据集根据划分矩阵完成了模糊划分。
模糊C-均值算法的目标函数定义如下:
dij=||xj-vi|| (1.2)
其中,C={C1,C2,…,Cc}表示集合,dij是对象xj到第i个子类的聚类中心的距离,U是一个n×c的划分矩阵,是Uij的集合。uij表示第j个对象xj对于第i类的隶属程序且uij∈[0,1]。uij满足如下约束条件:
同时,每一个对象对所有类的隶属度之和为1,即
公式中,m是模糊性参数,m∈[1,+∞)控制着算法的模糊程度:
m→1+时,uij→1或0,这个时候FCM算法就退化成了HCM算法;
m→+∞时,uij→1/c,这个时候FCM算法的聚类结果的模糊度处于最大状态,即m值增大则算法的模糊性增大。通常情况下m的值为2。
F(X,U,C)是类内误差加权平方和,FCM算法通过不断的迭代使目标函数F(X,U,C)最小化。
模糊C-均值算法的具体步骤如下:
Stepl:参数初始化。设定聚类数和模糊指数m(1<m<+∞),通常情况下取值为2。初始化聚类中心,得到V(0)={v1,v2,…,vc}。收敛精度ε(ε>0),迭代次数k=0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于李宏伟,未经李宏伟许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810935647.1/2.html,转载请声明来源钻瓜专利网。