[发明专利]一种基于双变加权核FCM算法的数据聚类方法有效
申请号: | 201810636707.X | 申请日: | 2018-06-20 |
公开(公告)号: | CN108763590B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 唐益明;胡相慧;丰刚永;华丹阳;任福继;张有成;宋小成 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 加权 fcm 算法 数据 方法 | ||
本发明公开了一种基于双变加权核FCM算法的数据聚类方法,首先对数据集合进行最优划分,使得目标函数最小;获得初始隶属度矩阵,典型值矩阵和初始聚类中心;计算多核高维空间中数据点和聚类中心的距离;迭代获得隶属度值,可能性典型值;以使目标函数得到最小值对应的聚类结果作为最终聚类结果。本发明采用组合核引导的核函数代替普通的欧式距离函数,能更好地划分线性数据和非线性数据;采用典型值矩阵来增强算法的抗噪性,提高算法聚类的准确率,可自动调整多种核在组合核中的比例来满足不同数据集对不同核函数的要求,解决了普通核算法对核函数选择的不确定问题。
技术领域
本发明涉及数据聚类技术领域,具体地说是一种基于双变加权核FCM算法的数据聚类方法。
背景技术
聚类是数据挖掘和人工智能领域重要的研究内容,在大数据、模式识别、图像分割、机器学习等诸多领域发挥了很大的作用。聚类就是根据数据的相似性规则对数据进行划分的过程,划分结果由规则决定,划分后的组或者集合,也常常称之为簇。模糊c均值聚类算法(FCM)是模糊聚类的一个最基本方法,为基于目标函数的聚类算法奠定了基础,但这个方法不仅对聚类中心初始化敏感,而且易受噪声点的影响。为了提高算法的抗噪性,Krishnapuram和Keller提出了PCM算法。PCM算法采用了可能性划分矩阵,可能性隶属度反映了数据点对某一聚类中心的典型度。另外,它放松了FCM算法中划分矩阵和为1的限制条件,相较FCM算法,PCM能更好地处理噪声点。然而PCM算法容易得到比预先设定的类别数还少的聚类中心或是相互重叠的类。
基于以上原因Zhang在文献中提出一种改进的可能性聚类算法聚类方式,增加一种新的参数ηi来减少算法的误差,虽然可能性的聚类算法能够克服一致性聚类的问题,然而对于原来的mp参数的选择异常敏感,不同的mp值即使相差很小,最后得到的聚类中心也会是两个截然不同的数值。Nikhil提出的一种改进的可能性模糊c均值聚类算法PFCM,PFCM算法具有很好的噪声鲁棒性,也不会产生重合的聚类,然而PFCM算法对参数a和b的选择通常需要人为的指定而缺乏理论上的依据,具有较强的依赖性。
以上算法对于线性数据具有很好的聚类效果,但是对于非线性数据的聚类往往效果不是很理想,通过引入核函数,将原始数据通过mercer核条件将样本数据X={x1,…,xn}映射到高维特征空间F中,映射数据为{φ(x1),...,φ(xn)},其中φ就是映射函数,并在空间F中对样本进行聚类,形成基于核的模糊聚类算法。Yang提出了基于核的模糊聚类算法KFCM,Genton也从统计学的角度展示了一种核的机器学习方式,这些算法使数据点映射到一个高维特征空间,通过使用内核函数和优化的聚类错误使其对于噪声和野值点具有很好的鲁棒性,克服了PFCM算法对参数设置敏感的问题,然而基于核的模糊聚类算法对于球形数据效果比较好,但是对于非球状数据往往得不到理想的效果。
Zhao et al.先前在文献中提出多核的最大核的分割聚类算法多关注于监督以及半监督的聚类学习,这是基于最大限度的边际聚类,然而很明显的一个缺点是其聚类算法多用于硬聚类。Hsin-Chien提出的多核的核方法对基础内核的选择和组合提供了很大的灵活性,这也从不同的角度增加了信息源,另外这也提高了领域知识的编码能力,但这些多核聚类算法的一个缺点是,内核的权重的指数通常难以确定,很难实现良好的内核权重分配。
发明内容
本发明为了克服上述现有技术存在的不足之处,提供一种基于双变加权核FCM算法的数据聚类方法,以期能准确地规避FCM对噪声点比较敏感,以及PCM容易产生一致性聚类的问题,增加算法的准确性,更准确地挖掘数据集中存在的数据结构信息。同时能自动发现最适合权重值以及当前隶属度值的大小,进而提高算法的可靠性和收敛性。
为了实现上述发明目的,本发明采用如下技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810636707.X/2.html,转载请声明来源钻瓜专利网。