[发明专利]基于模糊聚类最优k值选择算法的设备运行状态判断方法有效
申请号: | 202010110361.7 | 申请日: | 2020-02-21 |
公开(公告)号: | CN111291822B | 公开(公告)日: | 2023-05-05 |
发明(设计)人: | 崔国楠;王立松 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F18/241;G06N3/006;G06Q10/0639 |
代理公司: | 南京钟山专利代理有限公司 32252 | 代理人: | 上官凤栖 |
地址: | 210000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模糊 最优 选择 算法 设备 运行 状态 判断 方法 | ||
1.基于模糊聚类最优k值选择算法的设备运行状态判断方法,其特征在于,包括如下步骤:
步骤1:根据待测试设备的运行情况采集测试数据,并对数据进行数据清洗及数据归一化的预处理;
步骤2:根据处理后的测试数据,建立双目标模型;
步骤3:使用CDG优化算法对双目标模型进行优求解;
步骤4:使用DB指数对优化求解后的结果进行转换,计算得到最优聚类个数k;
步骤5:根据得到的最优聚类个数k,使用模糊聚算法FCM对经预处理的测试数据进行分析,将其划分为k个聚类;
步骤6:统计每一个聚类的数据中心、每个聚类中数据的特征、每个聚类所包括的范围,并根据这些聚类的特征情况判断当前设备的运行状态;
步骤2中,首先通过分析模糊聚类的紧凑度和分离度建立模糊聚类指标:
设X={x1,x2,x3,…,xn}为聚类分析的测试数据集,xi={xi1,xi2,xi3,…,xin}表示测试数据xi的n个特征,MSD为形态相似距离,紧凑度函数如下所示:
其中k为聚类中心个数,C={c1,c2,…,ck}为聚类中心的集合,U为隶属度矩阵,uij∈U为第j个数据在第i个聚类的隶属度系数,MSD(xj,ci)表示第j个数据在第i个聚类的偏差;
设Fp和Fq是属于一个模糊分区(k,U)的两个模糊聚类,分离度函数如下所示:
S(xj:Fp,Fq)=min(Fp(xj),Fq(xj))
其中S(Fp,Fq),p,q∈C为在数据集X中,模糊聚类Fp,Fq的相似性;Fp(xj)为xj在第p个聚类的协方差矩阵,h(xj)表示一种权值;
定义FDCS为紧密度Comp和分离度Sep之和,FDCS的值越小,则表示模糊聚类重叠程度更小,聚类内部更紧凑;
FDCS(k,U)=Comp(k,U)+Sep(k,U)
将FDCS进行如下的转换,保证了在非正确的聚类中心下目标函数f1和f2仍然是冲突的;
min F(x)=(f1(x)=1-exp-FDCS(k,U)-k,f2(x)=k}
其中f3代表聚类个数k,f1代表根据f2取值进行聚类划分的度量指标;
h(xj)根据模糊聚类之间重叠数据点的共享程度来调整对重叠数据点的强调程度,如下所示:
其中upj(xj)表示数据xj在模糊分区p中的隶属度,uqj(xj)表示数据xj在迷糊分区q中的隶属度;
步骤3具体包括以下步骤:
步骤3.1:初始化网格系统GS的网格邻居数以及网格距离、理想点、最低点;在建立GS之后对进行种群P随机初始化,并且基于P确定理想点和最低点;
步骤3.2:N个子代从P中生产,同时一个空集合Q被定义用于子代的排序;对于每一个解x={f1,f2},其匹配解都是通过邻居选择NS来获取的;
步骤3.3:从NS随机选择两个解xi,xj,xi,xj产生一个它们的子代y,之后将y添加到集合Q中;
步骤3.4:利用组合种群P=P∪Q更新理想和最低点,使其更加接近真实值;
步骤3.5:使用新的种群P更新GS;
步骤3.6:选择每个k值对应的非支配解;
步骤3.7:通过MOEA得到范围内所有k值的帕累托最优,并组成帕累托前沿;
步骤4中,通过聚类内散射与聚类间分离之和的比值得到最优的k值,DB指数越小则所划分的聚类个数k越好,当DB在规定范围内得到的最小值即为最优k值;
其中为第i个聚类内的散射值,Vi为该聚类的数据点数量,c为该聚类的聚类中心,dij=MSD(ci,cj)两个聚类中心的形态相似距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010110361.7/1.html,转载请声明来源钻瓜专利网。