[发明专利]一种基于Lasso-CCF-CNN的加氢裂化模型及建立方法在审
申请号: | 201910039551.1 | 申请日: | 2019-01-16 |
公开(公告)号: | CN109920489A | 公开(公告)日: | 2019-06-21 |
发明(设计)人: | 卢建刚;孙国庆;陈金水 | 申请(专利权)人: | 浙江大学 |
主分类号: | G16C20/10 | 分类号: | G16C20/10;G16C20/70;G06N3/04;G06N3/08 |
代理公司: | 浙江杭州金通专利事务所有限公司 33100 | 代理人: | 刘晓春 |
地址: | 310027 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提供一种基于Lasso‑CCF‑CNN的加氢裂化模型及建立方法,包括:利用三倍标准差检验法剔除原始数据中的异常值及使用minmax标准化对数据进行归一化处理以消除不同量纲带来的影响;使用Lasso法建立回归模型筛选出最重要的变量;利用CCF对已筛选出的变量计算其时滞及相关系数;按CCF计算出的相关系数对数据进行重新排列,并且以时滞大小作为时间窗长度,将一个时间窗内的数据当成一组输入数据;用以上处理好的输入数据训练卷积神经网络,加入批标准化层和dropout方法进行优化训练,获得最终的基于Lasso‑CCF‑CNN的加氢裂化模型。本发明所提供的建立方法能够高效地选出最重要的变量,克服变量选择的主观性问题,尽可能多地提取变量间的时序信息,显著地提高模型的精度与鲁棒性。 | ||
搜索关键词: | 加氢裂化 标准化 筛选 卷积神经网络 归一化处理 时间窗长度 主观性问题 组输入数据 变量计算 变量选择 回归模型 时序信息 优化训练 原始数据 重新排列 标准差 鲁棒性 时间窗 时滞 剔除 检验 | ||
【主权项】:
1.一种基于Lasso‑CCF‑CNN的加氢裂化模型的建立方法,其特征在于,所述基于Lasso‑CCF‑CNN的加氢裂化模型的建立方法包括:利用三倍标准差检验法剔除原始数据中的异常值及使用minmax标准化对数据进行归一化处理以消除不同量纲带来的影响;使用Lasso法建立回归模型筛选出最重要的变量;利用CCF对已筛选出的变量计算其时滞及相关系数;按CCF计算出的相关系数对数据进行重新排列,并且以时滞大小作为时间窗长度,将一个时间窗内的数据当成一组输入数据;用以上处理好的输入数据训练卷积神经网络,加入批标准化层和dropout方法进行优化训练,获得最终的基于Lasso‑CCF‑CNN的加氢裂化模型,具体包括以下步骤:步骤(1),对于样本个数为m、自变量个数为s、响应变量个数为1的样本集,将样本集表示为{输入矩阵X(m×s),输出矩阵Y(m×1)};定义全部变量集合为{x_1,x_2,…,x_s};定义λ为Lasso法的惩罚系数;设定相关系数的阈值为H,设定时滞的修正系数为k,设定CNN模型的卷积核尺寸为n×n,设定dropout的概率为p,设定CNN模型迭代训练次数为T,设定建模过程中批处理样本数为K;步骤(2),对步骤(1)所述的样本集进行计算得到其均值为μ及标准差为σ,然后剔除样本集中所有不在区间[μ‑3σ,μ+3σ]的样本;同时,将样本集划分为训练集及测试集;步骤(3),基于步骤(2)中划分的训练集和测试集选用min‑max标准化的方法分别对其进行归一化处理;步骤(4),对归一化后的训练集建立Lasso回归模型,并且使用10折交叉验证的方法来选出模型最小均方根误差对应的最优惩罚系数λbest;步骤(5),以找出的最优惩罚系数λbest建立的Lasso回归模型作为基础,通过回归模型的系数来判断每个变量对建立模型的重要程度,系数为0的变量对模型的回归预测几乎没有作用,将这些变量全部剔除,得到最终保留的变量集合{x_1,x_2,…,x_q},其中:q≤s;步骤(6),对最终筛选出的变量集合{x_1,x_2,…,x_q}进行CCF计算,得到每个变量相对于响应变量Y的时滞及相关系数,找出相关系数大于设定的相关系数阈值H的变量,并以这些变量的最大时滞作为整体的时滞,再乘以修正系数k得到最终时滞t;步骤(7),选定步骤(6)计算得到的时滞t作为时间窗长度WL,考虑利用卷积神经网络算法对局部特征提取的特性,将时间窗长度WL范围内的所有样本进行补零处理作为一个输入样本,得到新样本集{X_new,Y_new};步骤(8),将步骤(7)中所得新输入矩阵X_new作为输入变量,对应的输出矩阵Y_new作为目标变量,选定卷积核尺寸,确立网络结构,在网络中的所有卷积层后加入批标准化层,最后在全连接层使用dropout方法;步骤(9),将K个样本作为模型批处理的训练样本进行网络训练,迭代训练共T次后得到最终的基于Lasso‑CCF‑CNN的加氢裂化模型。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910039551.1/,转载请声明来源钻瓜专利网。