[发明专利]在线数据填补方法在审

专利信息
申请号: 202310086343.3 申请日: 2023-02-09
公开(公告)号: CN116226694A 公开(公告)日: 2023-06-06
发明(设计)人: 邓翔;陈适铭;徐永凯;张念东 申请(专利权)人: 珠海派诺科技股份有限公司
主分类号: G06F18/2321 分类号: G06F18/2321;G06N20/00
代理公司: 南昌市赣昌知识产权代理事务所(普通合伙) 36140 代理人: 刘鸿运
地址: 519085 广东省珠海市高新*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 在线 数据 填补 方法
【说明书】:

发明公开了一种在线数据填补方法。包括:根据历史数据使用标准化等相应的数据挖掘流程构建机器学习模型;通过分析统计历史预测填补缺失值序列和真实样本序列的误差找到填补缺失值序列和其对应的真实值序列的误差分布;针对数据缺失的A、B两个阶段分别处理,于A阶段,使用基于历史数据构建好的机器学习模型线上实时持续预测填补;于B阶段,对填补数据仿真,通过历史的误差分布来分配填补值和真实值的总差值还原到填补缺失值序列上,修正填补缺失值序列,修正后的填补缺失值序列将用于原机器学习模型的更新。该在线数据填补方法解决了现有数据填补方法响应速度慢、无法满足为实现短期调整的时效性问题。

技术领域

本发明涉及一种数据填补方法,尤其涉及一种基于机器学习模型在线预测、数据平滑、历史误差分布统计等的在线数据填补方法。

背景技术

近些年来基于数据的优化控制、调度、决策、故障诊断等,都基于完整的数据这样的前提。由于信号不稳定等原因而导致在工业数据序列中数据采集缺失的问题,很多厂家采用对序列的所有缺失值和后继的真实值求和,把求和值作为上报值,针对这种情况,对缺失数据进行填补。目前存在的数据填补方法,无论是基于均值缺失值等统计的方法,还是使用机器学习模型来预测缺失值的填补方法,都难以在短时间内解决相应数据缺失的问题,也难以在短时间内满足优化控制、调度、决策、故障诊断方法的时效性要求,并且难以满足填补误差较小的要求等。

发明内容

本发明的目的是针对上述现有技术存在的不足,提供了一种在线数据填补方法。本发明在线数据填补方法解决了现有数据填补方法响应速度慢、无法满足为实现短期调整的时效性、精度的问题。

本发明在线数据填补方法的技术方案包括:

根据历史数据使用标准化等相应的数据挖掘流程构建机器学习模型;

通过分析统计历史预测填补缺失值序列和真实样本序列的误差找到填补缺失值序列和其对应的真实值序列的误差分布;

针对数据缺失的A、B两个阶段分别处理,于A阶段,使用基于历史数据构建好的机器学习模型线上实时持续预测填补;于B阶段,对填补数据仿真,通过历史的误差分布来分配填补值和真实值的总差值还原到填补缺失值序列上,修正填补缺失值序列,修正后的填补缺失值序列将用于原机器学习模型的更新。

所述A阶段包括;某段数据缺失产生过程中,所述B阶段包括:某段数据缺失停止产生后。

本发明有益的技术效果:

本发明在线数据填补方法其包括通过针对数据缺失的A、B两个阶段分别处理等特有的技术手段,尤其是针对数据缺失停止产生时(即B阶段)对填补数据仿真的改进处理方式,获得数据填补的快速响应,能够实现在不损失预测精度的前提下提高填补速度,降低了因数据缺失导致对后续的短期预测和实时平衡调度的影响,具有更强的缺失数据的可填补性,从根本上增强和改善了缺失数据填补性能和效果,并减少人工介入。

附图说明

图1为本发明一实施例流程图;图2为本发明一实施例的在线学习过程流程图;图3为本发明的填补值序列图。

具体实施方式

为更好的理解本发明,现通过实施例结合附图对本发明的技术方案进行清楚、完整地说明。

本发明数据填补方法包括采取针对数据缺失的A、B两个阶段分别处理的方式。

其根据历史数据使用相应(如标准化等)的数据挖掘流程构建机器学习模型;

通过分析统计历史预测填补缺失值序列和真实样本序列的误差找到填补缺失值序列和其对应的真实值序列的误差分布;

针对数据缺失产生过程中(A阶段)处理,判断是否处于A阶段,若是,则使用基于历史数据构建好的机器学习模型线上实时持续预测填补;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海派诺科技股份有限公司,未经珠海派诺科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310086343.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top