[发明专利]散堆填料中液泛气速的建模和预报方法有效
申请号: | 201310113831.5 | 申请日: | 2013-04-02 |
公开(公告)号: | CN103279635A | 公开(公告)日: | 2013-09-04 |
发明(设计)人: | 刘毅;高增梁;李常跞 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F19/00 | 分类号: | G06F19/00 |
代理公司: | 杭州天正专利事务所有限公司 33201 | 代理人: | 王兵;黄美娟 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 用于散堆填料塔中液泛气速的非线性建模和预报方法,首先采用高斯混合模型方法对散堆填料塔的液泛数据进行有效的聚类;根据聚类后得到的子集分别建立相应的支持向量机子模型;再利用加权最小二乘方法,对这些液泛气速的子模型进行融合,最终,得到液泛气速的预报结果。使用该非线性集成模型,可以为各种类型的散堆填料塔中的液泛气速提供比较准确的模型,用于液泛气速的预报,有效提高相应塔设备的操作效率和安全性能。 | ||
搜索关键词: | 填料 中液泛气速 建模 预报 方法 | ||
【主权项】:
1.一种散堆填料塔液泛气速的预报方法,包括以下步骤:(1)将从以往的填料塔液泛实验中采集的相关液泛数据集作为一个样本,分析填料塔液泛的特征及影响因素,确定液泛气速预报模型的输入和输出;首先,选择影响液泛的流动参数作为模型的输入变量,主要有液相雷诺数ReL、斯托克斯数StL、伽利略数GaL及填料层厚度校正系数SB和填料球形度输出变量为Lockhart-Martinelli参数(χ),这些流动参数组成一个样本,用[xi,yi]表示,其中xi表示第i个样本的输入变量(每个样本包含5个输入变量),yi表示该样本的输出变量。模型的输出和输入变量的函数关系式可表示成下式:液泛数据来自国内1976~2007年的液泛相关文献,这些液泛数据源自不同塔径的填料塔,基本涵盖了目前工业现场常用的散堆填料;(2)采用高斯混合模型(GMM)聚类算法将液泛样本数据集聚类成若干个样本子集;假设n组液泛数据服从混合高斯分布,即样本数据可看成是从数个高斯分布中生成出来的,则GMM也可看成是由k个单高斯模型(SGM)组成的。则液泛数据样本xs的概率分布密度函数p(xs)为:p ( x s ) = Σ i = 1 k p ( i ) p ( x s | i ) = Σ i = 1 k α i N i ( x s | μ i , Σ i ) - - - ( 2 ) ]]> 其中,αi为混合权值,服从μi为均值,Σi为方差矩阵;而Ni(xs|μi,Σi)则表示第i个SGM的概率密度函数:N i ( x s | μ i , Σ i ) = 1 ( 2 π ) m | Σ i | exp [ - 1 2 ( x s - μ i ) T Σ i - 1 ( x s - μ i ) ] - - - ( 3 ) ]]> GMM聚类的核心则是找到一组这样的参数使它们所确定的概率分布生成这些给定的数据点的概率最大,这个概率为也称为似然函数;为计算方便,取其对数,得到对数似然函数:L ( X | Θ ) = log Π s = 1 n Σ i = 1 k α i N i ( x s | μ i , Σ i ) ]]>= Σ s = 1 n log Σ i = 1 k α i N i ( x s | μ i , Σ i ) - - - ( 4 ) ]]> 其中,Θ=(θ1,…θk),θi=(αi,μi,Σi)。由于对数似然函数里有加和,不能直接用求导方法直接求得最大值;因此本发明中采用期望最大(Expectation Maximum,EM)算法根据式(4)对GMM的参数αi,μi和Σi进行估计;EM算法分为E步和M步。E步是计算对数似然函数的期望,M步选择使期望最大的参数,并将所选择的参数代入E步,进行反复计算;E步:估计数据由第k个成分生成的概率为,即样本属于第k个成分的后验概率:η si = α i N i ( x s | μ i , Σ i ) Σ i = 1 k α i N i ( x s | μ i , Σ i ) - - - ( 5 ) ]]> M步:估计参数αi,μi和Σi的计算公式如下:α i = Σ s = 1 n η si n - - - ( 6 ) ]]>μ i = Σ s = 1 n η si x j Σ i = 1 n η si - - - ( 7 ) ]]>Σ i = Σ s = 1 n η si ( x s - μ i ) ( x s - μ i ) T Σ s = 1 n η si - - - ( 8 ) ]]> GMM是一个迭代过程,通过不断更新式(6)、式(7)与式(8),使式(4)计算的对数似然函数达到目标要求,然后停止迭代,输出此次迭代的概率分布密度函数p(x),即为液泛数据训练集最终的概率分布密度函数;基于概率分布密度函数使液泛数据训练集聚类成k个子集;(3)对聚类后的每个样本子集单独进行学习训练,建立基于最小二乘支持向量机(LSSVM)的预报液泛气速的子模型;聚类后的k个液泛数据样本子集单独进行训练,分别建立液泛气速模型。本发明采用核学习建模技术,先采用一个非线性映射φ:x→H将数据集的输入映射到高维特征空间中,后在此高维特征空间中估计回归函数。对于液泛数据集{xi,yi}(i=1,2,...,n),其模型可表示成:f(xi)=wTφ(xi)+b (9)式中xi∈Rd,yi∈R,为模型的权值向量,b为模型的偏置。根据结构风险最小化原则,使LSSVM在优化目标中的损失函数为误差ξi的二次项,构造其最优化问题:min J ( w , b , ξ i ) = 1 2 | | w | | 2 + γ 2 Σ i = 1 n ξ i 2 - - - ( 10 ) ]]> s.t.yi=wTφ(xi)+b+ξi,i=1,2,...,n (11)其目标函数由拟合误差平方和项以及正则化项组成;其中,通过调节γ,可控制模型的拟合能力;用拉格朗日法构造优化问题,并根据优化条件求解优化问题,可得如下方程组:0 v T v Ω + 1 γ I b β = 0 y - - - ( 12 ) ]]> 式中:y=[y1,…,yn]T,v=[1,…,1]T,β=[β1,…,βn]T,Ωik=φ(xi)Tφ(xk)(i,k=1,...,n)是满足Mercer条件的核函数。由式(15)求解可得到β与b,最终可得函数估计的液泛气速LSSVM模型:f ( x ) = Σ i = 1 n β i K ( x , x i ) + b - - - ( 13 ) ]]> 本发明中核函数采用径向基(RBF)核函数,其数学表达式为其中σ>0为RBF核函数参数。通过引入核函数,将高维特征空间中的点积运算转化为低维空间的核函数运算,避免了在高维空间中直接计算非线性映射φ的困难;(4)分别使用这些子模型单独进行液泛气速的预报,得到若干组预报结果,这些结果由一种加权最小二乘法(WLS)进行连接,得到的结果为填料液泛气速的最终预报值;由步骤(3)获得的k个液泛气速的子模型,分别对需要预报的填料进行预报,k组预报结果由一种连接方法进行连接融合,得到最后的预报结果。本发明采用WLS进行子模型结果的连接。k个子模型的预报结果的加权融合的实现过程为:根据最优原理推导出液泛气速子模型的输出残差与权系数的关系,建立权系数的优化模型:y ^ = hy + e - - - ( 14 ) ]]> 式中:为k个子模型输出分量构成的k维矢量;y为被估计的实际值;e=[e1,…,ek]T为各子模型输出分量的预报误差所构成的误差矢量;h=[1,…,1]T为k维常向量;WLS的估计准则是使加权误差平方和最小:J r ( y ~ ) = ( y ^ - h y ~ ) T R ( y ^ - h y ~ ) - - - ( 15 ) ]]> 式中:R=diag(r1,r2,…,rc)为正定对角加权矩阵。即对求极小值,有:∂ J r ( y ~ ) ∂ y ~ = - h T ( R + R T ) ( y ^ - h y ~ ) = 0 - - - ( 16 ) ]]> 由此可得到y的最小二乘估计,即子模型的预报结果的融合结果:y ~ = ( h T Rh ) - 1 h T R y ^ = Σ i = 1 k r i y ^ i / Σ i = 1 k r i - - - ( 17 ) ]]> 本发明中采用预报误差计算各组的权系数,即式中权系数δ∈(0,∞)为误差指数,控制子模型对集成模型的影响。从权系数计算式可知,子模型的预报误差越大,对应的权系数越小,该输出量对估计解的影响越低,可降低噪声数据的影响程度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310113831.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用