[发明专利]在线数据填补方法在审
申请号: | 202310086343.3 | 申请日: | 2023-02-09 |
公开(公告)号: | CN116226694A | 公开(公告)日: | 2023-06-06 |
发明(设计)人: | 邓翔;陈适铭;徐永凯;张念东 | 申请(专利权)人: | 珠海派诺科技股份有限公司 |
主分类号: | G06F18/2321 | 分类号: | G06F18/2321;G06N20/00 |
代理公司: | 南昌市赣昌知识产权代理事务所(普通合伙) 36140 | 代理人: | 刘鸿运 |
地址: | 519085 广东省珠海市高新*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 在线 数据 填补 方法 | ||
本发明公开了一种在线数据填补方法。包括:根据历史数据使用标准化等相应的数据挖掘流程构建机器学习模型;通过分析统计历史预测填补缺失值序列和真实样本序列的误差找到填补缺失值序列和其对应的真实值序列的误差分布;针对数据缺失的A、B两个阶段分别处理,于A阶段,使用基于历史数据构建好的机器学习模型线上实时持续预测填补;于B阶段,对填补数据仿真,通过历史的误差分布来分配填补值和真实值的总差值还原到填补缺失值序列上,修正填补缺失值序列,修正后的填补缺失值序列将用于原机器学习模型的更新。该在线数据填补方法解决了现有数据填补方法响应速度慢、无法满足为实现短期调整的时效性问题。
技术领域
本发明涉及一种数据填补方法,尤其涉及一种基于机器学习模型在线预测、数据平滑、历史误差分布统计等的在线数据填补方法。
背景技术
近些年来基于数据的优化控制、调度、决策、故障诊断等,都基于完整的数据这样的前提。由于信号不稳定等原因而导致在工业数据序列中数据采集缺失的问题,很多厂家采用对序列的所有缺失值和后继的真实值求和,把求和值作为上报值,针对这种情况,对缺失数据进行填补。目前存在的数据填补方法,无论是基于均值缺失值等统计的方法,还是使用机器学习模型来预测缺失值的填补方法,都难以在短时间内解决相应数据缺失的问题,也难以在短时间内满足优化控制、调度、决策、故障诊断方法的时效性要求,并且难以满足填补误差较小的要求等。
发明内容
本发明的目的是针对上述现有技术存在的不足,提供了一种在线数据填补方法。本发明在线数据填补方法解决了现有数据填补方法响应速度慢、无法满足为实现短期调整的时效性、精度的问题。
本发明在线数据填补方法的技术方案包括:
根据历史数据使用标准化等相应的数据挖掘流程构建机器学习模型;
通过分析统计历史预测填补缺失值序列和真实样本序列的误差找到填补缺失值序列和其对应的真实值序列的误差分布;
针对数据缺失的A、B两个阶段分别处理,于A阶段,使用基于历史数据构建好的机器学习模型线上实时持续预测填补;于B阶段,对填补数据仿真,通过历史的误差分布来分配填补值和真实值的总差值还原到填补缺失值序列上,修正填补缺失值序列,修正后的填补缺失值序列将用于原机器学习模型的更新。
所述A阶段包括;某段数据缺失产生过程中,所述B阶段包括:某段数据缺失停止产生后。
本发明有益的技术效果:
本发明在线数据填补方法其包括通过针对数据缺失的A、B两个阶段分别处理等特有的技术手段,尤其是针对数据缺失停止产生时(即B阶段)对填补数据仿真的改进处理方式,获得数据填补的快速响应,能够实现在不损失预测精度的前提下提高填补速度,降低了因数据缺失导致对后续的短期预测和实时平衡调度的影响,具有更强的缺失数据的可填补性,从根本上增强和改善了缺失数据填补性能和效果,并减少人工介入。
附图说明
图1为本发明一实施例流程图;图2为本发明一实施例的在线学习过程流程图;图3为本发明的填补值序列图。
具体实施方式
为更好的理解本发明,现通过实施例结合附图对本发明的技术方案进行清楚、完整地说明。
本发明数据填补方法包括采取针对数据缺失的A、B两个阶段分别处理的方式。
其根据历史数据使用相应(如标准化等)的数据挖掘流程构建机器学习模型;
通过分析统计历史预测填补缺失值序列和真实样本序列的误差找到填补缺失值序列和其对应的真实值序列的误差分布;
针对数据缺失产生过程中(A阶段)处理,判断是否处于A阶段,若是,则使用基于历史数据构建好的机器学习模型线上实时持续预测填补;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于珠海派诺科技股份有限公司,未经珠海派诺科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310086343.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:极柱焊接工艺及极柱
- 下一篇:一种从低锡品位锌硫浮选尾矿中回收锡的方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置