[发明专利]一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法在审
申请号: | 202010856767.X | 申请日: | 2020-08-24 |
公开(公告)号: | CN112001441A | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 康忠健;罗霖;李伟秀 | 申请(专利权)人: | 中国石油大学(华东) |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/06;G06Q50/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 266580 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 kmeans ahc 混合 算法 配电 网线 异常 检测 方法 | ||
1.一种基于Kmeans-AHC混合聚类算法的配电网线损异常检测方法,其特征在于,包括:
基于影响配电网线损的影响因素,构建配电网线损特征指标体系;
通过有监督指标与无监督指标相结合的综合指标数据来确定最优聚类中心数;
使用K-Means聚类算法与凝聚型层次聚类相结合的混合聚类算法,优化初始聚类中心的选取;
基于所确定的最优聚类中心数和初始聚类中心,对所述特征数据采用混合聚类进行聚类;
通过决策判断模型对配电网线损异常样本进行诊断识别。
2.如权利要求1所述的通过综合指标数据来确定最优聚类中心数,其特征在于,综合指标S的计算公式如下:
S=Ssp+Susp
式中,Ssp是有监督指标,对于数据集X={X1,X2,…,Xm},通过聚类得到的簇划分为C={C1,C2,…,Cn},数据集已知划分为P={P1,P2,…,Pn},a表示两个样本在C中属于同簇,且在P中同组;b表示两个样本在C中属于同簇,但在P中不同组;c表示两个样本在C中不同簇,但在P中同组。Susp是无监督指标,对于数据集中任一样本点i,p(i)是样本点i到所有它所属簇中其他点的距离平均值,q(i)是样本点i到它非所属簇内的其他点的距离平均值,m是样本总数。
3.如权利要求1所述的使用混合聚类算法优化初始聚类中心的选取,其特征在于,通过凝聚型层次聚类,确定初始聚类中心,包括以下步骤:
步骤1基于平均距离对样本进行凝聚型层次聚类;
步骤2根据聚类中心数的值对聚类树进行划分,分别计算层次聚类后各个簇内样本的均值;
步骤3将各个簇内样本均值作为K-Means聚类算法的初始聚类中心。
4.如权利要求1所述的通过决策判断模型对配电网线损异常样本进行诊断识别,其特征在于,对于聚类结果的决策判断,包括以下步骤:
步骤1将一段时间内平均线损率超过6%的样本判定为异常样本,其余样本进行混合聚类;
步骤2将聚类结果中包含样本数量少的簇看作异常类,则其中包含的样本判定为异常样本;
步骤3对于聚类结果中包含样本数量多的簇,通过欧氏距离与相关系数对该簇内位于边缘位置的样本进行异常判定,将相关系数小于阈值的边缘样本判定为异常样本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(华东),未经中国石油大学(华东)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010856767.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:涂敷装置以及涂敷方法
- 下一篇:一种气液分配设备