[发明专利]一种基于线性插值偏差的推进剂制备数据缺失值填补方法有效
申请号: | 202110669240.0 | 申请日: | 2021-06-17 |
公开(公告)号: | CN113313194B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张维;张浩晨 | 申请(专利权)人: | 西北工业大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/241;G06N3/0464;G06N3/08 |
代理公司: | 西安凯多思知识产权代理事务所(普通合伙) 61290 | 代理人: | 刘新琼 |
地址: | 710072 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 线性插值 偏差 推进 制备 数据 缺失 填补 方法 | ||
本发明公开了一种基于线性插值偏差的推进剂制备数据缺失值填补方法,首先对连续缺失值进行线性插值填补,然后对缺失值以及缺失值前后一个真实值进行线性插值和线性回归进行拟填补,再根据拟填补所得的两种结果计算偏差值Δ1,最后通过偏差拟合得到第一次线性插值所存在的偏差Δ2,最终通过弥补偏差得到最终的缺失值填补值,对后续的产品质量分类以及质量预测和控制提供完整有效的数据基础。本发明降低了测试样本的填补值和真实值的平均误差。
技术领域
本发明属于改性双基推进剂制备技术领域,具体涉及一种数据短时缺失值填补方法。
背景技术
目前,针对于缺失值的处理最为广泛的常用的方法包括忽略含缺失项的记录、将缺失值视为特殊值或者插补缺失值。采用删除含缺失项记录的方法能够最大程度保证数据的真实性和有效性,但是当数据样本量小时,删除含缺失项记录会大大影响数据的分布以及变化趋势,而采用填充的方法比简单删除记录更有利于后续数据的利用。从数据分析的角度看,缺失值的这种未知性掩盖了数据分布,干扰了属性相关性的发现,这使得统计分析结果大打折扣,影响最终决策。
在对缺失值进行填补处理时,目前所采用的例如线性插值和线性回归方法,对工业生产数据进行填补时都会导致填补的数据缺少工业数据分布所有的耦合性和时序性,尤其当工业生产数据样本量少且波动性不大时,每一项数据对整体的波动性都有极大的影响,且工业生产数大多具有耦合性,每一项工艺特征都与其他工艺特征具有线性或非线性的关心,同一项工艺中所有的不同特征参数也具有强相关性。因此,在对工业数据进行缺失项填补时,必须同时考虑到数据自身所具有的波动性特征,以及缺失数据所在特征与其他工艺特征所产生的相关性。
发明内容
为了克服现有技术的不足,本发明提供了一种基于线性插值偏差的推进剂制备数据缺失值填补方法,首先对连续缺失值进行线性插值填补,然后对缺失值以及缺失值前后一个真实值进行线性插值和线性回归进行拟填补,再根据拟填补所得的两种结果计算偏差值Δ1,最后通过偏差拟合得到第一次线性插值所存在的偏差Δ2,最终通过弥补偏差得到最终的缺失值填补值,对后续的产品质量分类以及质量预测和控制提供完整有效的数据基础。本发明降低了测试样本的填补值和真实值的平均误差。
本发明解决其技术问题所采用的技术方案包括如下步骤:
步骤1:对改性双基推进剂制备质量数据中所有的2到4个连续缺失值进行线性插值;
步骤1-1:确定改性双基推进剂制备质量数据中连续缺失值的数据所在的特征列X;
步骤1-2:确定改性双基推进剂制备质量数据中连续缺失项的数据所在特征列X的位置Xp-Xp+n,1<n<5;
步骤1-3:按照公式(1)对改性双基推进剂制备质量数据中含有连续缺失值的特征列X直接进行第一次线性插值得到连续缺失项Xp-Xp+n的值,分别为Xp,1-Xp+n,1,公式(1)如下:
其中,ta与ya是待求数据点对应的时刻与估计值,te与ye是数据缺失时间段后首个有效记录点对应的时刻与实际值,ts与ys是数据缺失时间段前最近有效记录点对应的时刻与实际值;
步骤1-4:将步骤1-3中改性双基推进剂制备质量数据中连续缺失项的填补值Xp,1-Xp+n,1中的中间填补值Xp+1,1-Xp+n-1,1作为第一次直接线性插值后的待去除真实偏差的值YAp+1-YAp+n-1;
步骤2:对改性双基推进剂制备质量数据中连续缺失项进行线性回归计算;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北工业大学,未经西北工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110669240.0/2.html,转载请声明来源钻瓜专利网。