[发明专利]一种电力设备退役数据补全方法及系统有效
申请号: | 202011291722.9 | 申请日: | 2020-11-18 |
公开(公告)号: | CN112287562B | 公开(公告)日: | 2023-03-10 |
发明(设计)人: | 廖孟柯;樊冰;郭浩明;付林;李忠政;赵军;周二彪;朱剑利 | 申请(专利权)人: | 国网新疆电力有限公司经济技术研究院;华北电力大学;国家电网有限公司 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06F16/215;G06F111/10;G06F113/04;G06F119/04 |
代理公司: | 北京高沃律师事务所 11569 | 代理人: | 孙玲 |
地址: | 830002 新疆维吾尔*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力设备 退役 数据 方法 系统 | ||
1.一种电力设备退役数据补全方法,其特征在于,包括:
对电力设备退役数据进行预处理;预处理后的电力设备退役数据包括多个字段;
基于数据完整度将多个所述字段划分为保留组和待定组;
基于数据相关性将所述待定组划分为删除组和独立分析组,并将所述删除组中的数据进行删除;
基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全;
利用补全后的数据对电力设备退役数据数据库进行填补;
获取所述独立分析组中字段未缺失的数据,形成独立分析数据库;
其中,基于数据相关性将所述待定组划分为删除组和独立分析组,具体包括:计算所述待定组中各字段与数据退役年限的相关性;若所述待定组中的字段与数据退役年限无相关性,则划分为删除组;若所述待定组中的字段与数据退役年限有相关性,则计算所述待定组中的字段与所述保留组中字段的相关性;若所述待定组中的字段与所述保留组中字段的相关性高于设定阈值时,则划分为删除组;若所述待定组中的字段与所述保留组中字段的相关性低于设定阈值时,则划分为独立分析组;
所述计算所述待定组中各字段与数据退役年限的相关性的公式如下:
式中,为待定组中第j个字段与退役年限的相关性,Xj表示待定组中第j个字段,Y表示退役年限,E(XjY)为待定组中第j个字段与退役年限的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Y)为退役年限的数学期望,为待定组中第j个字段的方差,σY为退役年限的方差;
所述计算所述待定组中的字段与所述保留组中字段的相关性的公式如下:
式中,为待定组中第j个字段与保留组中第k个字段的相关性,Xj表示待定组中第j个字段,Xk表示保留组中第k个字段,E(XjXk)为待定组中第j个字段与保留组中第k个字段的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Xk)为保留组中第k个字段的数学期望,为第j个字段的方差,σk为保留组中第k个字段的方差;
所述基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全,具体包括:
初始化混合高斯模型;
标记所述保留组中各字段的未知量及已知量,并按照设备编号进行排序;
对于所述保留组中各字段设置隐变量;
根据初始混合高斯模型以及所述保留组中各字段计算所述隐变量的最大似然估计值;
根据所述隐变量计算混合高斯模型的参数;
根据所述参数更新所述隐变量的最大似然估计值;
根据更新后的最大似然估计值更新所述未知量,完成所述保留组中的数据的补全。
2.根据权利要求1所述的电力设备退役数据补全方法,其特征在于,所述基于数据完整度将预处理后的电力设备退役数据划分为保留组和待定组,具体包括:
计算各所述字段的完整度;
将完整度高于完整度阈值的字段划分为保留组;
将完整度低于完整度阈值的字段划分为待定组。
3.根据权利要求2所述的电力设备退役数据补全方法,其特征在于,所述计算各所述字段的完整度的公式如下:
其中,s为字段完整度,Nknow为字段已知数据数,N为字段全部数据数。
4.一种电力设备退役数据补全系统,其特征在于,包括:
预处理模块,用于对电力设备退役数据进行预处理;预处理后的电力设备退役数据包括多个字段;
第一划分模块,用于基于数据完整度将多个所述字段划分为保留组和待定组;
第二划分模块,用于基于数据相关性将所述待定组划分为删除组和独立分析组,并将所述删除组中的数据进行删除;
补全模块,用于基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全;
填补模块,用于利用补全后的数据对电力设备退役数据数据库进行填补;
数据获取模块,用于获取所述独立分析组中字段未缺失的数据,形成独立分析数据库;
其中,基于数据相关性将所述待定组划分为删除组和独立分析组,具体包括:计算所述待定组中各字段与数据退役年限的相关性;若所述待定组中的字段与数据退役年限无相关性,则划分为删除组;若所述待定组中的字段与数据退役年限有相关性,则计算所述待定组中的字段与所述保留组中字段的相关性;若所述待定组中的字段与所述保留组中字段的相关性高于设定阈值时,则划分为删除组;若所述待定组中的字段与所述保留组中字段的相关性低于设定阈值时,则划分为独立分析组;
所述计算所述待定组中各字段与数据退役年限的相关性的公式如下:
式中,为待定组中第j个字段与退役年限的相关性,Xj表示待定组中第j个字段,Y表示退役年限,E(XjY)为待定组中第j个字段与退役年限的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Y)为退役年限的数学期望,为待定组中第j个字段的方差,σY为退役年限的方差;
所述计算所述待定组中的字段与所述保留组中字段的相关性的公式如下:
式中,为待定组中第j个字段与保留组中第k个字段的相关性,Xj表示待定组中第j个字段,Xk表示保留组中第k个字段,E(XjXk)为待定组中第j个字段与保留组中第k个字段的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Xk)为保留组中第k个字段的数学期望,为第j个字段的方差,σk为保留组中第k个字段的方差;
所述基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全,具体包括:
初始化混合高斯模型;
标记所述保留组中各字段的未知量及已知量,并按照设备编号进行排序;
对于所述保留组中各字段设置隐变量;
根据初始混合高斯模型以及所述保留组中各字段计算所述隐变量的最大似然估计值;
根据所述隐变量计算混合高斯模型的参数;
根据所述参数更新所述隐变量的最大似然估计值;
根据更新后的最大似然估计值更新所述未知量,完成所述保留组中的数据的补全。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司经济技术研究院;华北电力大学;国家电网有限公司,未经国网新疆电力有限公司经济技术研究院;华北电力大学;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011291722.9/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置