[发明专利]一种园区综合能源异常数据识别方法在审
申请号: | 202010227575.2 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111459926A | 公开(公告)日: | 2020-07-28 |
发明(设计)人: | 孙乐平;韩帅;吴宛潞;郭小璇;陈卫东;肖静;秦丽娟;杨艺云;吴宁;戴承承;廖敏乐 | 申请(专利权)人: | 广西电网有限责任公司电力科学研究院 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06Q10/06;G06Q50/06;G06K9/62 |
代理公司: | 北京国帆知识产权代理事务所(普通合伙) 11334 | 代理人: | 李增朝 |
地址: | 530015 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 综合 能源 异常 数据 识别 方法 | ||
1.一种园区综合能源异常数据识别方法,其特征在于,所述方法包括:
对聚类中心进行初始化,从N个样本数据中随机选择K个样本数据,所述K个样本数据分别为K个聚类簇中每一个聚类簇的中心点;
基于每一个聚类簇的中心点,将所述N个样本数据中所剩下的N-K个样本数据分别填补到K个聚类簇中所对应的一个聚类簇,所述N-K个样本数据为所述N个样本数据除去所述K个样本数据后所剩下的样本数据;
将填补后的K个聚类簇中每一个聚类簇的中心点进行更新;
判断填补后的K个聚类簇中每一个聚类簇所包含的样本数据与更新后的中心点之间所形成的准则函数是否收敛;
若所述准则函数收敛,则通过不同的聚类方式从填补后的K个聚类簇中获取最佳聚类的k个聚类簇,并将所述k个聚类簇中相对距离较大的点定义为所述N个样本数据中的异常数据。
2.根据权利要求1所述的园区综合能源异常数据识别方法,其特征在于,所述将所述N个样本数据中所剩下的N-K个样本数据分别对应填补到K个聚类簇中的一个聚类簇包括:
从所述N-K个样本数据中获取第i个数据,计算第i个数据到K个聚类簇中每一个聚类簇的中心点的最小欧几里得距离;
获取所述最小欧几里得距离所对应的第一聚类簇,并将第i个数据归类到所述第一聚类簇中,所述第一聚类簇为K个聚类簇中的一个;
判断i是否小于N-K;
若i小于N-K,则将i+1赋值给i,返回计算第i个数据到K个聚类簇中每一个聚类簇的中心点的最小欧几里得距离;
若i不小于N-K,则将填补后的K个聚类簇中每一个聚类簇的中心点进行更新。
3.根据权利要求2所述的园区综合能源异常数据识别方法,其特征在于,所述欧几里得距离L为:
其中,xi为第i个数据,yj为K个聚类簇中的第j个聚类簇的中心点,d为欧几里得空间的维数。
4.根据权利要求1所述的园区综合能源异常数据识别方法,其特征在于,所述将填补后的K个聚类簇中每一个聚类簇的中心点进行更新包括:
从填补后的K个聚类簇中获取第j个聚类簇,计算第j个聚类簇中所包含的样本数据的平均向量,所述平均向量为第j个聚类簇的中心点;
判断j是否小于K;
若j小于K,则将j+1赋值给j,返回计算第j个聚类簇中所包含的样本数据的平均向量;
若j不小于K,则判断填补后的K个聚类簇中每一个聚类簇所包含的样本数据与更新后的中心点之间所形成的准则函数是否收敛。
5.根据权利要求4所述的园区综合能源异常数据识别方法,其特征在于,所述准则函数为:
其中,SSE为所述N个样本数据的平方误差总和,mi为填补后的K个聚类簇中第i个聚类簇Ci的中心点(平均值),p为第i个聚类簇Ci的样本数据(非中心点)。
6.根据权利要求5所述的园区综合能源异常数据识别方法,其特征在于,在判断填补后的K个聚类簇中每一个聚类簇所包含的样本数据与更新后的中心点之间所形成的准则函数是否收敛之后,还包括:
若所述准则函数发散,返回将所述N个样本数据中所剩下的N-K个样本数据分别对应填补到K个聚类簇中的一个聚类簇,其中所述K个聚类簇为所述填补后的K个聚类簇。
7.根据权利要求1所述的园区综合能源异常数据识别方法,其特征在于,所述通过不同的聚类方式从填补后的K个聚类簇中获取最佳聚类的k个聚类簇包括:
从填补后的K个聚类簇中按照不同的聚类数量选取k个聚类簇,并计算k个聚类簇的最小DB指标,所述最小DB指标所对应的k个聚类簇为最佳聚类结果。
8.根据权利要求7所述的园区综合能源异常数据识别方法,其特征在于,所述DB指标为:
其中,k为聚类数量,且2≤k∈N,N为样本数据的总量,Wi为第i个聚类簇Ci中所包含的样本数据到更新后的中心点Oi的平均距离,Wj为第j个聚类簇Cj中所包含的样本数据到更新后的中心点Oj的平均距离,Cij为中心点Oi到中心点Oj的距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西电网有限责任公司电力科学研究院,未经广西电网有限责任公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010227575.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置