[发明专利]一种电力设备退役数据补全方法及系统有效

专利信息
申请号: 202011291722.9 申请日: 2020-11-18
公开(公告)号: CN112287562B 公开(公告)日: 2023-03-10
发明(设计)人: 廖孟柯;樊冰;郭浩明;付林;李忠政;赵军;周二彪;朱剑利 申请(专利权)人: 国网新疆电力有限公司经济技术研究院;华北电力大学;国家电网有限公司
主分类号: G06F30/20 分类号: G06F30/20;G06F16/215;G06F111/10;G06F113/04;G06F119/04
代理公司: 北京高沃律师事务所 11569 代理人: 孙玲
地址: 830002 新疆维吾尔*** 国省代码: 新疆;65
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 电力设备 退役 数据 方法 系统
【权利要求书】:

1.一种电力设备退役数据补全方法,其特征在于,包括:

对电力设备退役数据进行预处理;预处理后的电力设备退役数据包括多个字段;

基于数据完整度将多个所述字段划分为保留组和待定组;

基于数据相关性将所述待定组划分为删除组和独立分析组,并将所述删除组中的数据进行删除;

基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全;

利用补全后的数据对电力设备退役数据数据库进行填补;

获取所述独立分析组中字段未缺失的数据,形成独立分析数据库;

其中,基于数据相关性将所述待定组划分为删除组和独立分析组,具体包括:计算所述待定组中各字段与数据退役年限的相关性;若所述待定组中的字段与数据退役年限无相关性,则划分为删除组;若所述待定组中的字段与数据退役年限有相关性,则计算所述待定组中的字段与所述保留组中字段的相关性;若所述待定组中的字段与所述保留组中字段的相关性高于设定阈值时,则划分为删除组;若所述待定组中的字段与所述保留组中字段的相关性低于设定阈值时,则划分为独立分析组;

所述计算所述待定组中各字段与数据退役年限的相关性的公式如下:

式中,为待定组中第j个字段与退役年限的相关性,Xj表示待定组中第j个字段,Y表示退役年限,E(XjY)为待定组中第j个字段与退役年限的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Y)为退役年限的数学期望,为待定组中第j个字段的方差,σY为退役年限的方差;

所述计算所述待定组中的字段与所述保留组中字段的相关性的公式如下:

式中,为待定组中第j个字段与保留组中第k个字段的相关性,Xj表示待定组中第j个字段,Xk表示保留组中第k个字段,E(XjXk)为待定组中第j个字段与保留组中第k个字段的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Xk)为保留组中第k个字段的数学期望,为第j个字段的方差,σk为保留组中第k个字段的方差;

所述基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全,具体包括:

初始化混合高斯模型;

标记所述保留组中各字段的未知量及已知量,并按照设备编号进行排序;

对于所述保留组中各字段设置隐变量;

根据初始混合高斯模型以及所述保留组中各字段计算所述隐变量的最大似然估计值;

根据所述隐变量计算混合高斯模型的参数;

根据所述参数更新所述隐变量的最大似然估计值;

根据更新后的最大似然估计值更新所述未知量,完成所述保留组中的数据的补全。

2.根据权利要求1所述的电力设备退役数据补全方法,其特征在于,所述基于数据完整度将预处理后的电力设备退役数据划分为保留组和待定组,具体包括:

计算各所述字段的完整度;

将完整度高于完整度阈值的字段划分为保留组;

将完整度低于完整度阈值的字段划分为待定组。

3.根据权利要求2所述的电力设备退役数据补全方法,其特征在于,所述计算各所述字段的完整度的公式如下:

其中,s为字段完整度,Nknow为字段已知数据数,N为字段全部数据数。

4.一种电力设备退役数据补全系统,其特征在于,包括:

预处理模块,用于对电力设备退役数据进行预处理;预处理后的电力设备退役数据包括多个字段;

第一划分模块,用于基于数据完整度将多个所述字段划分为保留组和待定组;

第二划分模块,用于基于数据相关性将所述待定组划分为删除组和独立分析组,并将所述删除组中的数据进行删除;

补全模块,用于基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全;

填补模块,用于利用补全后的数据对电力设备退役数据数据库进行填补;

数据获取模块,用于获取所述独立分析组中字段未缺失的数据,形成独立分析数据库;

其中,基于数据相关性将所述待定组划分为删除组和独立分析组,具体包括:计算所述待定组中各字段与数据退役年限的相关性;若所述待定组中的字段与数据退役年限无相关性,则划分为删除组;若所述待定组中的字段与数据退役年限有相关性,则计算所述待定组中的字段与所述保留组中字段的相关性;若所述待定组中的字段与所述保留组中字段的相关性高于设定阈值时,则划分为删除组;若所述待定组中的字段与所述保留组中字段的相关性低于设定阈值时,则划分为独立分析组;

所述计算所述待定组中各字段与数据退役年限的相关性的公式如下:

式中,为待定组中第j个字段与退役年限的相关性,Xj表示待定组中第j个字段,Y表示退役年限,E(XjY)为待定组中第j个字段与退役年限的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Y)为退役年限的数学期望,为待定组中第j个字段的方差,σY为退役年限的方差;

所述计算所述待定组中的字段与所述保留组中字段的相关性的公式如下:

式中,为待定组中第j个字段与保留组中第k个字段的相关性,Xj表示待定组中第j个字段,Xk表示保留组中第k个字段,E(XjXk)为待定组中第j个字段与保留组中第k个字段的联合数学期望,E(Xj)为待定组中第j个字段的数学期望,E(Xk)为保留组中第k个字段的数学期望,为第j个字段的方差,σk为保留组中第k个字段的方差;

所述基于自适应混合高斯模型最大似然估计对所述保留组中的数据进行补全,具体包括:

初始化混合高斯模型;

标记所述保留组中各字段的未知量及已知量,并按照设备编号进行排序;

对于所述保留组中各字段设置隐变量;

根据初始混合高斯模型以及所述保留组中各字段计算所述隐变量的最大似然估计值;

根据所述隐变量计算混合高斯模型的参数;

根据所述参数更新所述隐变量的最大似然估计值;

根据更新后的最大似然估计值更新所述未知量,完成所述保留组中的数据的补全。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司经济技术研究院;华北电力大学;国家电网有限公司,未经国网新疆电力有限公司经济技术研究院;华北电力大学;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011291722.9/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top