[发明专利]一种基于双变加权核FCM算法的数据聚类方法有效
申请号: | 201810636707.X | 申请日: | 2018-06-20 |
公开(公告)号: | CN108763590B | 公开(公告)日: | 2021-07-27 |
发明(设计)人: | 唐益明;胡相慧;丰刚永;华丹阳;任福继;张有成;宋小成 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 安徽省合肥新安专利代理有限责任公司 34101 | 代理人: | 何梅生 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于双变加权核FCM算法的数据聚类方法,首先对数据集合进行最优划分,使得目标函数最小;获得初始隶属度矩阵,典型值矩阵和初始聚类中心;计算多核高维空间中数据点和聚类中心的距离;迭代获得隶属度值,可能性典型值;以使目标函数得到最小值对应的聚类结果作为最终聚类结果。本发明采用组合核引导的核函数代替普通的欧式距离函数,能更好地划分线性数据和非线性数据;采用典型值矩阵来增强算法的抗噪性,提高算法聚类的准确率,可自动调整多种核在组合核中的比例来满足不同数据集对不同核函数的要求,解决了普通核算法对核函数选择的不确定问题。 | ||
搜索关键词: | 一种 基于 加权 fcm 算法 数据 方法 | ||
【主权项】:
1.一种基于双变加权核FCM算法的数据聚类方法,用于对客户信息进行聚类,根据聚类结果对客户进行产品推荐,其特征是按如下步骤进行:步骤1、数据集合X为客户信息,X={x1,x2,…,xn},xj为第j个数据点;j=1,2,…,n,n是数据的总个数;对数据集合X进行最优划分,使得式(1)中的目标函数J值为最小:式(1)中,i表示第i类,c表示划分的类别数,且1≤i≤c,2≤c≤n;uij表示第j个数据点xj隶属于第i类的隶属度值;为uij的m次幂,m是表示聚类模糊程度的加权指数,tij表示第j个数据点xj隶属于第i类的可能性典型值,为tij的η次幂,η为加权指数,用于控制隶属度和典型值的比例实现双变;Dij表示多核高维度特征空间的第j个数据点xj和多核高维度特征空间的第i类的聚类中心vi之间的距离,并有:式(2)中,wl是核的权重参数,M是核的总个数,αijk由式(3)所表达:式(3)中,kl(xj,xq)是由式(4)所表达的第l个高斯核函数:式(4)中的是函数的宽度参数,xjl,xql分别表示第j个数据点和第q个数据点的第l维特征值;式(1)中,表示第j个数据点xj的权重系数,并有:式(5)中,θ表示常数;xz表示第z个数据点,1≤z≤n;||xj‑xz||表示第j个数据点xj和第z个数据点xz之间的欧式距离;式(1)中,ri表示惩罚因子,并有:式(6)中||xj‑vi||表示第j个数据点和第i个聚类中心的欧式距离;步骤2、利用模糊C均值聚类算法FCM对所述数据集合X进行处理,获得隶属度矩阵U和聚类中心V分别为:由式(6)计算获得参数惩罚因子ri,并以利用模糊C均值聚类算法FCM获得的隶属度矩阵U作为双变加权核FCM算法的初始隶属度矩阵U(0);步骤3、随机初始化第j个数据点xj隶属于第i类的典型值定义迭代次数为iter,最大迭代次数为iterMax;并初始化iter=1;则第iter次迭代的隶属度矩阵为U(iter),第iter次迭代的典型值矩阵为T(iter);步骤4、由式(3)得到参数步骤5、由式(7)得到参数βl:步骤6、由式(8)得到第iter次迭代的核的权重参数步骤7、由式(2)获得多核高维度特征空间的第j个数据点xj和多核高维度特征空间的第i类的聚类中心vi之间的距离Dij的平方;步骤8、由式(9)获得第iter次迭代的第j个数据点xj隶属于第i类的典型值步骤9、由式(10)获得第iter次迭代的第j个数据点xj隶属于第i类的隶属度值步骤10、设定阈值ε,判断算法停止条件或iter>iterMax是否成立,若成立,则为最优隶属度值,对于第j个数据点xj,取其最大值所对应的i值得到数据点xj属于第i类,根据得到的隶属度矩阵U(iter),得到所有属于第i类的数据点集合Y,计算yj是第i类的数据点集合Y中第j个数据,式是集合Y的平均值,n′是属于第i类的数据点总个数,则第i类的聚类中心同样的方法获得其它类的聚类中心;根据聚类中心矩阵对新的客户进行产品推荐;若停止条件不成立,则将iter的值增加1,重复执行步骤4到步骤10直到满足条件为止。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810636707.X/,转载请声明来源钻瓜专利网。