[发明专利]基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法有效
申请号: | 201710599053.3 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107423503B | 公开(公告)日: | 2020-06-23 |
发明(设计)人: | 熊伟丽;彭慧来;陈树 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于核慢特征分析和时滞估计的高斯过程回归建模对脱丁烷塔底部的丁烷浓度进行预测的方法。用于具有时延和非线性的化工过程。该方法首先通过模糊曲线分析充分挖掘工业数据中的时延信息,求出数据中的最优时滞,并进行建模数据的重构;进一步通过核慢特征分析方法对重构数据进行非线性的特征提取;最后,基于提取后的特征建立高斯过程回归模型,实现对关键变量的精确预测,从而提高产品质量,降低生产成本。 | ||
搜索关键词: | 基于 特征 分析 估计 过程 回归 建模 丁烷 底部 浓度 进行 预测 方法 | ||
【主权项】:
基于核慢特征分析和时滞估计的GPR建模方法,其特征在于,该方法步骤为:步骤1:收集输入输出数据组成历史训练数据库步骤2:标准化训练样本数据,并将每个输入变量进行Tmax+1维扩展。其中,Tmax为最大时延步骤3:通过模糊曲线分析(fuzzy curve analysis,FCA)确定各输入变量的最优时滞,定义为d1,d2,...,dm。其中m为样本的维度,所述的模糊曲线分析算法为:通过构建输入和输出变量之间的模糊逻辑,从而确定对输出变量重要的输入变量;假设有m个输入变量{xi,i=1,2,...,m}和输出变量y,采集到的样本个数为n,令xik为第k个样本的第i个变量,yk为对应的输出变量;对于每个输入变量xi,i=1,2,...,m在第k个样本处的模糊隶属度函数φik(xi)定义为:式中,φik为变量xi所对应的第k个样本点的输入变量模糊隶属函数;φik这里选取为高斯函数,b选取为输入变量xi范围的20%;因此对于n个训练样本对应的每个输入变量都有n条模糊规则,其中第k个规则描述为:Rk:if xi isφik(xi),then y is yk;通过式(2)对输入变量xi进行重心去模糊化,计算得到其对应的模糊曲线为ci;进一步通过式(3),可以计算出模糊曲线ci的变化范围Rci;若得到的Rci越大,表明此时输入变量对于输入变量越重要;Rci=max(ci)‑min(ci) (3)由于共有m个输入变量,故能得到m个Rci,将Rci大小按降序排列,可以得到各输入变量的重要性;通过引入时滞信息,原有的输入变量xi转变为Tmax+1维:{xi(t),xi(t‑1),…,xi(t‑d),…,xi(t‑Tmax)},其中t为输出变量的采样时刻,d为待确定的时滞变量,Tmax为最大的变量时延值;根据模糊曲线法原理,将{xi(t),xi(t‑1),…,xi(t‑d),…,xi(t‑Tmax)}转化为Tmax+1个待选输入变量,从中选取一个最重要的变量xi(t‑d),则d即为该输入变量所对应的最优时滞;求取出各输入变量的最优时滞分别为d1,d2,...,dm后,则进行样本数据的重构步骤4:对重构后的训练样本进行标准化处理,并通过核慢特征分析(kernel slow feature analysis,KSFA)确定其核慢特征和相应特征向量矩阵;慢特征分析算法为:给定一个p维的时序输入信号X(t)={x1(t),x2(t),...,xp(t)},SFA算法旨在找到一个q维的变换函数G(x)={g1(X),g2(X),...gq(X)},使得q维的输出信号S(t)={S1(t),S2(t),...,Sq(t)}变化尽可能缓慢;其中Sj(t):=gj(X(t)),j∈[1,2,...,q];SFA算法最终转化为一个优化问题:且满足约束条件:<Sj>t=0 (5)<(Sj)2>t=1, (6)其中为Sj的一阶导数,<·>t为时间平均式(4)为优化目标函数,使得输出信号变化最为缓慢;式(5)表示的零均值约束,仅仅是为了简化问题的求解;单位方差约束(6)不但对输出信号的尺度进行了归一化,还避免了常值解的出现,使输出信号必须包含一定的信息;式(7)保证了输出信号的各个分量之间是不相关的,避免了冗余信号的出现;除此之外,慢特征根据其变化快慢进行排序,若按升序排序,即S1(t)是最缓慢的特征,S2(t)是次缓慢的特征,以此类推;当变换函数gj(·)为线性时,此时每个慢特征Sj都是输入变量的线性组合,即:Sj=gj(X)=X(t)wj (8)由于X(t)已经预先进行了均值化处理,因此满足式(5)的约束条件,式(4)优化目标和约束条件(6)可以重写为:式中,B=<X(t)TX(t)>t,进而公式(9)的优化求解问题等价于如下的广义特征值分解问题:AW=BWΛ (10)其中,Λ=(λ1,...λq)为广义特征值构成的对角矩阵且λ1<λ2<…<λq,W=(w1,…wp)为对应的广义特征向量矩阵,式(4)的优化目标正是对角矩阵Λ中的主对角元素。当变换函数gj(·)为非线性时,此时的变换函数可以等效为线性变换函数在非线性空间的扩展,多项式扩展为常用的扩展方式,以二阶多项式扩展为例,定义如下:经过二阶扩展后,的维度由p维变成了L维,其中L=p+p(p+1)/2,将进行均值化处理后得V(x),将V(x)替换式(8)中的X(t),就将非线性情况转化成了线性情况;核慢特征分析就是将核函数扩展方法代替多项式扩展从而加强对非线性数据的处理,从而实现非线性特征提取;核函数的选取有多种选择,这里选择泛化和平滑估计能力强的高斯核函数:将经过核函数扩展后的数据K代替二阶多项式扩展的V(t),优化目标就转换为:其中,式(10)的优化目标求解问题等价于如下的广义特征值分解问题:AkW=BkWΛ (15)其中,表示的协方差阵,Bk=<KTK>t表示K的协方差阵步骤5:通过交叉验证确定核慢特征个数,并将此时的核慢特征向量矩阵和对应的核慢特征分别记为W,Str;然后基于(Str,Y)建立高斯过程回归模型,其中Y表示重组训练样本中的输出变量,建立的GPR模型为:给定训练样本集X∈RD×N和y∈RN,其中X={xi∈RD}i=1...N,y={yi∈R}i=1...N分别代表D维的输入和输出数据,输入和输出之间的关系由公式(16)产生:y=f(x)+ε (16)其中f是未知的函数形式,ε是均值为0,方差为的高斯噪声,对于一个新的输入x*,相应的概率预测输出y*也满足高斯分布,其均值和方差如式(17)和(18)所示:y*(x*)=cT(x*)C‑1y (17)式中c(x*)=[c(x*,x1),…,c(x*,xn)]T是训练数据和测试数据之间的协方差矩阵,是训练数据之间的协方差矩阵,I是N×N维的单位矩阵,c(x*,x*)是测试数据的自协方差。GPR可以选择不同的协方差函数c(xi,xj)产生协方差矩阵Σ,只要选择的协方差函数能保证产生的协方差矩阵满足非负正定的关系,这里选择高斯协方差函数:式中v控制协方差的量度,ωd代表每个成分xd的相对重要性;对式(19)中的未知参数v,ω1,…,ωD和高斯噪声方差的估计,采用极大似然估计得到参数为了求得参数θ的值,首先将参数θ设置为一个合理范围内的随机值,然后用共轭梯度法得到优化的参数,获得最优参数θ后,对于测试样本x*,可以用式(17)和(18)来估计GPR模型的输出值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710599053.3/,转载请声明来源钻瓜专利网。
- 上一篇:一种光影自由变吊灯
- 下一篇:基于改进赋权法的丘区耕地整理潜力评价方法