[发明专利]一种基于大数据的工业蒸汽量预测方法有效
申请号: | 201910486534.2 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110222416B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 王进;张睿;陈重元;邓欣;孙开伟;刘彬 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20;G06K9/62;G06Q10/04;F22B35/00 |
代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
地址: | 400065 重*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 工业 蒸汽 预测 方法 | ||
1.一种基于大数据的工业蒸汽量预测方法,其特征在于,包括以下步骤:
101.获取锅炉的工况数据,并对锅炉的工况数据先后进行缺失值处理、异常值处理和对非对称分布的处于偏斜状态的数据进行偏态修正三个数据预处理操作;
102.采用以区间覆盖为基础的自助法,根据工况数据的采集时间划分训练集数据、验证集数据,并对锅炉工况数据进行特征工程操作;
103.建立多个机器学习模型,并采用基于Filter和线性加权的瀑布融合法进行模型融合操作;
104.通过步骤103建立的融合模型,根据锅炉传感器采集的工况数据对锅炉产生的蒸汽量进行预测,利用预测的蒸汽量求得锅炉的燃烧效率运用在工业生产上;
所述步骤102根据锅炉传感器对工况数据的采集时间划分训练集数据、验证集数据具体步骤为:
采用以区间覆盖为基础的自助法划分训练集数据和验证集数据,在锅炉传感器以每分钟为单位采集的7天的工况数据中,将每两个小时作为一个小区间,这样7天168个小时可以划分为84个小区间,在这些小区间Di中进行采样产生Di':Di'表示从Di中随机且有放回地采样得到的数据集,每次随机从Di中挑选一个样本,并将其拷贝一份放入Di'中,保持Di不变,重复以上过程m次,Di中有部分样本会多次出现在Di',而另一部分不会出现;
将∑Di'当作训练集,将∑(Di'\Di)当作验证集;
所述步骤103建立多个机器学习模型,并基于Filter和线性加权的瀑布融合法进行模型融合操作的具体步骤为:
采用将多个模型串联的方法,将每个基模型视为一个过滤器,将不同粒度的过滤器进行前后衔接,对于样本集近似于正态分布的数据,基模型的选择中保证线性与非线性相结合,线性模型选择Lasso回归模型、线性的Kernel ridge regression模型和使用L1和L2先验作为正则化矩阵的模型ElasticNet,另外三个非线性基模型选择分别为基于多项式的Kernel ridge regression模型、SVR模型和Xgboost模型;
在基于Filter和线性加权的瀑布融合法中,前一个模型过滤的结果,将作为后一个模型的候选集合输入,模型共三层,每一层基模型的顺序为线性模型在前,非线性模型在后,最后对非线性模型的输出结果进行线性加权,得到最终的融合模型;
所述对训练集和测试集进行特征工程构建具体包括:对锅炉工况数据构建基础统计特征、模块特征、外部特征和时序特征;
1031.基础统计特征:对锅炉床温、床压、湿度,炉膛温度、膛压、湿度以及过热器的温度、压强、湿度以每小时为单位区间进行求均值和求众数的操作,之后再对所求出的均值和众数再取平均,将其作为特征,同时,将锅炉的额定功率及实际功率通过物理运算提特征,直接将ratio值作为特征列;
1032.模块特征:将特征工程模块化,将其分为炉膛、锅炉床、锅炉风口、主蒸汽四个模块,分别研究每个模块内的温度、湿度和压力值,按照锅炉传感器以分钟为单位采集的各种锅炉工况数据,分别在模块内提取特征,提取特征的方法为在模块内部对每分钟的温度、湿度和压强求方差,通过模块内部的数据的波动来构建模块特征;
1033.外部特征:通过对当地气候的查询,获得训练集和测试集当天的气温、空气湿度、风速以及阳光强度这些外部数据;将这些外部数据同样以每分钟为单位进行统计加入到特征工程中,在加入这些离散型数据特征时,使用FP-growth算法来挖掘频繁项集,找出已给的多条数据记录中哪些项是频繁一起出现的;
1034.时序特征:对一天内某一时段的蒸汽量进行预测,时间是特征工程中不可或缺的一部分;针对时间的字段,统计当前时刻与温度峰值、压强峰值和湿度峰值时刻的时间差值,直接将其当做连续值特征,另外,再将每天的时段进行离散化处理构建特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910486534.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置