[发明专利]一种基于贝叶斯高斯混合模型的即时学习软测量建模方法在审
申请号: | 201810516991.7 | 申请日: | 2018-05-25 |
公开(公告)号: | CN108804784A | 公开(公告)日: | 2018-11-13 |
发明(设计)人: | 熊伟丽;祁成;马君霞 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06K9/62 |
代理公司: | 哈尔滨市阳光惠远知识产权代理有限公司 23211 | 代理人: | 张勇 |
地址: | 214000 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于贝叶斯高斯混合模型的即时学习软测量建模方法,属于复杂工业过程建模和软测量领域。本发明用于具有非线性、非高斯性的时变工业过程,通过一种在线实时更新局部的策略,采用贝叶斯信息准则确定最优的高斯成分个数,当新的测试数据到来时,计算其隶属于每个高斯成分的后验概率,并求出其与训练数据之间的马氏距离,将两者融合作为相似度指标;最后,从原始的训练样本中选取相似度最大的一组数据来建立当前的GPR模型,并进行模型输出预测,达到了提高产品质量,降低生产成本的效果。 | ||
搜索关键词: | 高斯混合模型 软测量建模 贝叶斯 相似度 高斯 贝叶斯信息准则 复杂工业过程 测量领域 测试数据 工业过程 后验概率 马氏距离 实时更新 输出预测 训练数据 训练样本 非高斯 组数据 建模 时变 融合 学习 | ||
【主权项】:
1.一种基于贝叶斯高斯混合模型的即时学习软测量建模方法,其特征在于,所述方法包括:步骤1:收集输入、输出数据得到历史训练数据集;步骤2:X为已知训练样本,利用贝叶斯信息准则BIC确定最优的高斯成分个数K,BIC的描述如公式(1):BIC=‑2logp(X|Θ)+dlog(N) (1)式(1)中logp(X|Θ)表示训练样本的对数似然函数,d表示K个高斯成分所具有的自由参数的个数,N表示训练样本的个数;步骤3:根据最优的高斯成分个数K后和给定高斯混合模型GMM的初始参数,利用式(5)、(6)、(7)不断迭代,直到前后两次参数的差值小于设定好的阈值,得到最终GMM的参数Θ,GMM的详细描述如下:包含N个训练样本的数据集X{xi∈Rm,i=1,2…N},m表示输入数据的维数,该数据集的概率密度函数表示为:
其中,Θ=[α1,μ1,Σ1;α2,μ2,Σ2;……;αk,μk,Σk]是GMM的参数,K是高斯成分的个数,θk为第k个高斯成分的参数,θk=(μk,Σk),μk和Σk分别为第k个高斯成分的均值和协方差矩阵,αk为第k个高斯成分所占的比例,且
0<αk<1,其中第k个高斯成分的概率密度函数为:
通过期望最大化算法对GMM方法中的未知参数进行求解,具体求解过程分为E步和M步,其描述如下:E步:根据当前第l次更新的参数
和
通过贝叶斯公式计算第i个训练样本属于第k个高斯成分的概率
其中Ck表示第k个高斯成分
M步:更新算法参数![]()
![]()
步骤4:当来到一个新的输入数据xq,采用即时学习JITL算法从历史数据集中选择与之最相似的一组数据建立局部的高斯过程回归GPR模型,JITL算法和GPR建模方法的详细描述分别如下:JITL算法:JITL方法是根据相似输入产生相似输出的思想,从训练样本中选择与当前到来的测试样本最相似的一组训练样本来建模,JITL的核心是相似度准则的选取,基于欧式距离和角度的相似度准则是一种常用的方法,即:
其中,距离d表示当前到来的测试样本与训练样本之间的2范数,θ表示这两个样本之间的夹角,γ为一系数,取值在0到1之间;然而,对于一些非高斯工业过程,GMM可以较好地对过程的非高斯性进行描述,相比于传统的相似度准则,基于贝叶斯高斯混合模型BGMM的相似度准则可以更好地选择相似样本来建立GPR模型,由步骤2和3分别得到的最优的高斯成分个数K和各个成分的参数Θ,对应的相似度准则可以表示为:
其中xq表示新到来的样本,xi表示第i个训练样本,p(Ck|xq)表示新到来的样本xq属于第k个高斯成分的后验概率,
为两样本之间的马氏距离,针对当前到来的xq,利用上述相似度准则,选择与xq最相似的一组数据建立当前的GPR模型GPR建模方法:已知训练样本集X{xi∈Rm,i=1,2…N}和Y{yi∈R,i=1,2…N}分别代表m维输入数据和1维输出数据,输入和输出之间的关系可以表示为:yi=f(xi)+ε (10)其中f表示一种未知的函数形式,ε表示均值为0,方差为
的白噪声对于新的测试样本xq,则它的输出预测值yq也满足高斯分布,其均值和方差分别表示为:yq(xq)=cT(xq)C‑1Y (11)
其中,c(xq)=[c(xq,x1),…,c(xq,xN)]T是测试输入数据与训练输入数据的协方差矩阵,
为训练输入数据之间的协方差矩阵,c(xq,xq)表示测试输入数据与本身的协方差值;GPR选择径向基协方差函数,其函数描述如下:
其中,v表示先验知识的总体度量,ωt表示每维数据相对应的权重,δij为Kronecher算子,表示各辅助变量的相对重要程度;采用极大似然估计得到式(13)中的参数
其对数似然函数为:
使用训练集和验证集将参数θ试凑出来,然后用共轭梯度法得到优化的参数,参数确定后,对于新的测试数据,可由式(11)得到软测量模型输出;步骤5:将新到来的样本点xq带入步骤4建立好的局部GPR模型,得到最终的估计值yq。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810516991.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种毛坯初始残余应力的测评方法
- 下一篇:一种冲击荷载计算方法及装置