[发明专利]一种电力设备状态监测数据缺失值分类插补方法和系统有效
申请号: | 202010481374.5 | 申请日: | 2020-05-31 |
公开(公告)号: | CN111694827B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 王有元;刘航;陈伟根;杜林;李剑;李后英;周湶;王飞鹏;谭亚雄;万福;黄正勇 | 申请(专利权)人: | 重庆大学 |
主分类号: | G06F18/15 | 分类号: | G06F18/15;G06F18/2411;G06F18/2431;G06F18/27;G06N3/045;G06N3/0442;G06N3/08;G06Q50/06 |
代理公司: | 北京智绘未来专利代理事务所(普通合伙) 11689 | 代理人: | 赵卿;肖继军 |
地址: | 400044 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力设备 状态 监测 数据 缺失 分类 方法 系统 | ||
1.一种电力设备状态监测数据缺失值分类插补方法,其特征在于:
所述方法包括以下步骤:
步骤1:获取电力设备状态在线监测数据集Xm×n,Xm×n包含m个样本,每个样本包含n类状态变量;
步骤2:根据Xm×n中测量值缺失特点,对Xm×n中的缺失值进行分类,具体的:
将Xm×n中的缺失值划分为孤立缺失值、连续缺失状态变量和连续缺失样本三种缺失类型;
若Xm×n中的某个测量值发生缺失,但其前后相邻样本的同类状态变量测量值完整已知,则这类缺失的测量值被定义为孤立缺失值;
若Xm×n中某类状态变量的测量值在一段时间内连续缺失,但同一时段内,如果至少n/2种状态变量没有发生连续缺失,这类连续缺失的测量值为连续缺失状态变量;
若Xm×n中至少n/2种状态变量在一段时间内同时出现了连续的缺失,则该时段内的所有缺失值为连续缺失样本;
步骤3:构建不同类型缺失值的插补模型并进行缺失值插补,实现状态监测数据缺失值的修复,具体包括以下步骤:
步骤3.1:根据不同位置的K-1组连续缺失样本将Xm×n分割为K段数据子段,具体为:
Xm×n=[X(1),Xinc(1),...,X(k),Xinc(k),...,Xinc(K-1),X(K)]T (2)
其中,X(k)(k=1,…,K)中只含有孤立缺失值和连续缺失状态变量,Xinc(k)(k=1,…,K-1)由连续缺失样本构成;
步骤3.2:对于各X(k)(k=1,…,K)中的孤立缺失值,采用缺失值前后相邻的完整测量值构造一维插值函数进行插补;
步骤3.3:对于各X(k)(k=1,…,K)中的连续缺失状态变量,在步骤3.2完成孤立缺失值插补后,以待插补数据子段以外的数据子段中相同时段的完整状态变量作为输入,待插补的数据子段连续缺失状态变量为输出,构建回归分析模型进行插补;
步骤3.4:对于各Xinc(k)中的连续缺失样本,以完成步骤3.2孤立缺失值且完成步骤3.3连续缺失样本的数据子段X(k)为输入,构建逐步外推预测模型实现对Xinc(k)中连续缺失样本的插补。
2.根据权利要求1所述的一种电力设备状态监测数据缺失值分类插补方法,其特征在于:
步骤3.2中构造的一维插值函数为:
式中,是第i个样本第j类状态变量测量值xi,j的插补值。
3.根据权利要求1所述的一种电力设备状态监测数据缺失值分类插补方法,其特征在于:
步骤3.3中,使用多元线性回归分析模型、神经网络、支持向量机回归或随机森林构建回归分析模型。
4.根据权利要求1所述的一种电力设备状态监测数据缺失值分类插补方法,其特征在于:
步骤3.4中,使用基于长短时记忆网络的深度学习模型、循环神经网络、或门限循环单元模型构建逐步外推预测模型。
5.一种电力设备状态监测数据缺失值分类插补系统,包括获取模块、分类模块和插补模块,其特征在于:
所述获取模块,用于获取电力设备状态在线监测数据集Xm×n,Xm×n包含m个样本,每个样本包含n类状态变量;
所述分类模块,用于根据Xm×n中测量值缺失特点,对Xm×n中的缺失值进行分类,具体的:
将Xm×n中的缺失值划分为孤立缺失值、连续缺失状态变量和连续缺失样本三种缺失类型;
若Xm×n中的某个测量值发生缺失,但其前后相邻样本的同类状态变量测量值完整已知,则这类缺失的测量值被定义为孤立缺失值;
若Xm×n中某类状态变量的测量值在一段时间内连续缺失,但同一时段内,如果至少n/2种状态变量没有发生连续缺失,这类连续缺失的测量值为连续缺失状态变量;
若Xm×n中至少n/2种状态变量在一段时间内同时出现了连续的缺失,则该时段内的所有缺失值为连续缺失样本;
所述插补模块,用于构建不同类型缺失值的插补模型并进行缺失值插补,实现状态监测数据缺失值的修复,具体包括:
1):根据不同位置的K-1组连续缺失样本将Xm×n分割为K段数据子段,具体为:
Xm×n=[X(1),Xinc(1),...,X(k),Xinc(k),...,Xinc(K-1),X(K)]T (2)
其中,X(k)(k=1,…,K)中只含有孤立缺失值和连续缺失状态变量,Xinc(k)(k=1,…,K-1)由连续缺失样本构成;
2):对于各X(k)(k=1,…,K)中的孤立缺失值,采用缺失值前后相邻的完整测量值构造一维插值函数进行插补;
3):对于各X(k)(k=1,…,K)中的连续缺失状态变量,在2)完成孤立缺失值插补后,以待插补数据子段以外的数据子段中相同时段的完整状态变量作为输入,待插补的数据子段连续缺失状态变量为输出,构建回归分析模型进行插补;
4):对于各Xinc(k)中的连续缺失样本,以完成2)孤立缺失值且完成3)连续缺失样本的数据子段X(k)为输入,构建逐步外推预测模型实现对Xinc(k)中连续缺失样本的插补。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆大学,未经重庆大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010481374.5/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置