[发明专利]一种基于Stacking的高炉铁水质量区间预测方法有效
申请号: | 201910283970.X | 申请日: | 2019-04-10 |
公开(公告)号: | CN110066895B | 公开(公告)日: | 2021-01-12 |
发明(设计)人: | 周平;刘进进;谢晋;柴天佑 | 申请(专利权)人: | 东北大学 |
主分类号: | C21B5/00 | 分类号: | C21B5/00 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 刘晓岚 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 stacking 高炉 铁水 质量 区间 预测 方法 | ||
1.一种基于Stacking的高炉铁水质量区间预测方法,其特征在于,具体步骤如下:
步骤1:获取高炉原始历史数据,并进行预处理,包括:对数据统一时间粒度、剔除休风数据和异常数据以及归一化数据,具体包括如下步骤:
步骤1.1:按时间先后顺序对采集的数据进行标注,使用最近邻时间原则,即按照时间的先后顺序,人工进行匹配得到时间粒度一致的高炉炼铁过程的历史数据;
步骤1.2:剔除休风数据和异常数据:剔除休风数据,具体方式为:依据交班记录确定高炉计划检修时间段,剔除此时间段的高炉本体休风数据,休风数据具体指热风炉不向高炉吹风的数据;剔除异常数据,采用拉依达准则,即3σ准则进行异常值的剔除,即数据偏差大于3σ的数据应该剔除;σ为筛选出的高炉本体数据的标准差,如下公式所示:
步骤1.3:对高炉数据进行数据归一化处理,得到归一化后的高炉历史数据作为样本数据集,如下公式所示:
其中,xi、分别为第i个变量归一化前、后的取值,max(xi)、min(xi)分别为第i个变量的最大值、最小值,归一化处理后的数据在如下范围内:xi∈(-1,1);
步骤2:获取高炉多元铁水质量指标软测量所需输入输出参数,并根据输入输出参数从预处理后的高炉原始历史数据提取样本数据集;
步骤2.1:根据高炉工艺机理确定需要软测量的高炉铁水质量输出参数为Si(硅)含量y1,%、P(磷)含量y2,%、S(硫)含量y3,%和铁水温度y4,℃;
步骤2.2:采取灰色关联性分析的方法,提取前k个关联度最高的高炉本体参数作为软测量的辅助变量,包括:炉腹煤气量u1,m3、热风温度u2,℃、热风压力u3,KPa、富氧率u4、鼓风湿度u5,RH、喷煤量u6,m3/h;
步骤2.3:根据过程动态特性,基于上述6个辅助变量,引入非线性自回归模型(NARX),确定如下16个变量为软测量模型的输入变量:
当前时刻炉腹煤气量u1(t),m3;当前时刻热风温度u2(t),℃;当前时刻热风压力u3(t),kPa ;当前时刻富氧率u4(t);当前时刻鼓风湿度u5(t),RH;当前时刻设定喷煤量u6(t),m3/h;上一时刻Si含量y1(t-1),%;上一时刻P含量y2(t-1),%;上一时刻炉腹煤气量u1(t-1),m3;上一时刻热风温度u2(t-1),℃;上一时刻热风压力u3(t-1),KPa;上一时刻富氧率u4(t-1);上一时刻鼓风湿度u5(t-1),RH;上一时刻设定喷煤量u6(t-1),m3/h;上一时刻S含量y3(t-1),%;上一时刻铁水温度y4(t-1),℃;
步骤2.4:根据输入输出参数,从预处理后的高炉原始历史数据中,提取训练数据集,其中,输出参数为离线测量的实际输出,输入参数为在线软测量的历史数据;
步骤3:基于高炉多元铁水质量指标软测量所需输入输出参数,建立基于N折模型的Stacking算法铁水质量模型并计算建模误差预测区间;
步骤3.1:建立基于N折模型的Stacking算法铁水质量模型,具体骤步骤如下:
步骤3.1.1:第一层学习器训练数据的切分;
对训练数据集进行k-fold切分为k份,每一分包括k-1个学习集和1个预测集,共进行N次切分;
步骤3.1.2:第一层学习器的训练;
取第N次切分的K-1个学习集,采用随机权神经网络进行建模,得到模型N,取第N次切分预测集在模型N上进行预测,得到预测结果N,并将所有N次预测结果传递给第二层学习器中;
步骤3.1.3:第二层学习器的训练;
将第一层学习器传递过来的N次预测结果作为第二层学习器的新的训练集,并将步骤2.4所述训练数据集中输出参数作为标签数据,采用随机权神经网络进行建模,得到N折模型的Stacking算法铁水质量模型;
步骤3.2:计算预测区间;步骤3.2所述计算预测区间,具体步骤如下:
步骤3.2.1:基于N折模型的Stacking算法铁水质量模型,由训练集模型的输出真实值和预测值进行做差,得到建模误差集如下所示:
其中ei为第i个建模误差,yi为第i个输出真实值,为第i个模型预测值;
步骤3.2.2:使用核密度估计方法估计出建模误差集的概率分布曲线,这样将具有不确定性的建模误差用确定性的概率密度函数表征;
所述核密度估计的方法如下:
假设zi∈R,i=1,…,K为独立同分布随机变量,其所服从分布密度函数为f(z),z∈R,则f(z)的核密度估计定义为:
其中,φ(·)称为核函数,hp通常称为窗口宽度或光滑参数,是一个预先人工给定的正数;
利用核密度估计方法对于步骤3.2.1得到的建模误差集{ei|i=1,2…K}进行PDF估计,得到估计建模误差概率密度函数Γe为:
所述φ(·)核函数的选择:满足以下条件:
a.φ(z)≥0
b.∫φ(z)du=1
选取高斯核函数,其表式如下:
hp所述窗口宽度的选择:窗宽hp设置为hp=1.06θK-1/5,其中θ由min{S,0.746Q}估计,S表示样本标准差,Q为四分位数间距,K为e样本集个数;
步骤3.2.3:由估计出的概率密度函数曲线,得到该曲线符合高斯分布,计算符合设定概率的建模误差区间,该区间即为预测区间,具体步骤如下:
步骤3.2.3.1:通过统计学的方法求取建模误差集的标准差σ1如下所示:
其中,上式中ei为第i个建模误差,K为建模误差的个数;
步骤3.2.3.2:定义建模误差正负3倍的标准差作为模型的建模误差的预测区间;
步骤4:根据N折模型的Stacking算法铁水质量模型对实时采集的高炉数据进行预测,得到预测值和预测区间:将获取的实时待测试高炉数据,经过步骤1中进行预处理,经过步骤2获取高炉多元铁水质量指标软测量所需输入输出参数,并根据输入输出参数从预处理后的高炉原始历史数据提取待测试数据,将待测试数据输入到第一层学习器中,得到N个预测值,并且将N个预测值取平均值,将该平均值输入到第二层学习器中,使用训练好的N折模型的Stacking算法铁水质量模型,得到最终的预测值,并根据步骤3.2得到预测区间,输出最终的预测值与预测区间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910283970.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种新型渣罐车
- 下一篇:一种高炉配加高铝塞拉利昂矿冶炼方法