[发明专利]基于时间序列分析的输变电设备的状态监测数据清洗方法在审
申请号: | 201410806481.5 | 申请日: | 2014-12-22 |
公开(公告)号: | CN104537034A | 公开(公告)日: | 2015-04-22 |
发明(设计)人: | 郭志红;杜修明;杨祎;陈玉峰;盛戈皞;严英杰 | 申请(专利权)人: | 国家电网公司;国网山东省电力公司电力科学研究院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/06 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 张勇 |
地址: | 100031 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 时间 序列 分析 变电 设备 状态 监测 数据 清洗 方法 | ||
技术领域
本发明涉及基于时间序列分析的输变电设备的状态监测数据清洗方法。
背景技术
对设备在线监测、带电检测、离线试验等设备全景状态信息进行全方位分析,提升输变电设备评价与异常诊断的准确性是设备状态评估诊断技术的发展趋势。输变电设备全景状态信息呈现来源多、信息异构、数量庞大、属性繁多等特点,其数据往往是不完整的、有噪声的和不一致的。状态量原始的数据质量往往不能满足后续状态评价模型的要求,因此在状态评估或诊断分析之前进行数据清洗是必不可少的。数据清洗通过填充缺失值、平滑噪声数据和识别离群点来提高数据质量,有助于提高数据挖掘过程的准确率和效率。
在输变电设备数据清洗方面,国内外现有的研究较少。文献《基于贝叶斯网络分类器的变压器综合故障诊断方法》在建立故障与信息的映射关系时将海量数据通过粗糙集信息熵的方法进行了约简,从而解决了数据缺失的问题,但是破坏了数据自身信息的完整性。
文献《A Kernel Fuzzy c-Means Clustering-Based Fuzzy Support Vector Machine Algorithm for Classification Problems with Outliers or Noises》和《FSVM-CIL:Fuzzy Support Vector Machines for Class Imbalanced Learning》在处理支持向量机训练集的噪声和异常数据时使用了模型C均值聚类方法,通过计算数据到聚类中心的距离来分离出噪声数据。但是这种聚类方法将分离出的噪声数据直接剔除,破坏了状态量数据链的连续性。以上研究在数据清洗过程中都丢弃了造成了数据的丢失,不利于在后续状态评估中对数据本身信息的挖掘。
发明内容
本发明的目的就是为了解决上述问题,提供一种基于时间序列分析的输变电设备的状态监测数据清洗方法,它具有清洗效率高、保持了数据的完整性、避免数据有用信息丢失的优点。
为了实现上述目的,本发明采用如下技术方案:
基于时间序列分析的输变电设备的状态监测数据清洗方法,步骤如下:
步骤(1):建立输变电设备状态数据的初始时间序列模型,通过初始时间序列模型估计初始拟合的残差序列和残差方差;
步骤(2):
步骤(2-1):利用步骤(1)的初始时间序列模型,计算每个观测点的检验统计量;
步骤(2-2):判断检验统计量的绝对值的最大值是否大于设定阈值,如果大于,则确定存在对初始时间序列模型拟合影响的噪声点,通过修正时间序列数据来修正噪声点,通过返回步骤(2)继续识别并修正时间序列所有的噪声点,然后进入步骤(2-3);如果小于就进入步骤(2-3);
步骤(2-3):拟合修正后的时间序列模型,估计修正后的时间序列模型的模型残差;
步骤(3):通过步骤(2-3)中修正后的时间序列模型的模型残差计算每个观测点的检验统计量,根据检验统计量的绝对值的最大值是否大于设定阈值来判断是否存在新的噪声点,直到所有的噪声点都被识别出,如果存在就返回步骤(2),如果不存在就结束。
所述步骤(1)的步骤为:
对观测序列Zt建立时间序列模型,
设Zt是单个状态量的无异常值的时间序列,Zt服从ARIMA(p,d,q)模型,表示为
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司;国网山东省电力公司电力科学研究院;,未经国家电网公司;国网山东省电力公司电力科学研究院;许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410806481.5/2.html,转载请声明来源钻瓜专利网。