[发明专利]一种基于贝叶斯高斯混合模型的即时学习软测量建模方法在审

申请号：	201810516991.7	申请日：	2018-05-25
公开（公告）号：	CN108804784A	公开（公告）日：	2018-11-13
发明（设计）人：	熊伟丽;祁成;马君霞	申请（专利权）人：	江南大学
主分类号：	G06F17/50	分类号：	G06F17/50;G06K9/62
代理公司：	哈尔滨市阳光惠远知识产权代理有限公司 23211	代理人：	张勇
地址：	214000 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于贝叶斯高斯混合模型的即时学习软测量建模方法，属于复杂工业过程建模和软测量领域。本发明用于具有非线性、非高斯性的时变工业过程，通过一种在线实时更新局部的策略，采用贝叶斯信息准则确定最优的高斯成分个数，当新的测试数据到来时，计算其隶属于每个高斯成分的后验概率，并求出其与训练数据之间的马氏距离，将两者融合作为相似度指标；最后，从原始的训练样本中选取相似度最大的一组数据来建立当前的GPR模型，并进行模型输出预测，达到了提高产品质量，降低生产成本的效果。
搜索关键词：	高斯混合模型软测量建模贝叶斯相似度高斯贝叶斯信息准则复杂工业过程测量领域测试数据工业过程后验概率马氏距离实时更新输出预测训练数据训练样本非高斯组数据建模时变融合学习
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于贝叶斯高斯混合模型的即时学习软测量建模方法，其特征在于，所述方法包括：步骤1：收集输入、输出数据得到历史训练数据集；步骤2：X为已知训练样本，利用贝叶斯信息准则BIC确定最优的高斯成分个数K，BIC的描述如公式(1)：BIC＝‑2logp(X|Θ)+dlog(N) (1)式(1)中logp(X|Θ)表示训练样本的对数似然函数，d表示K个高斯成分所具有的自由参数的个数，N表示训练样本的个数；步骤3：根据最优的高斯成分个数K后和给定高斯混合模型GMM的初始参数，利用式(5)、(6)、(7)不断迭代，直到前后两次参数的差值小于设定好的阈值，得到最终GMM的参数Θ，GMM的详细描述如下：包含N个训练样本的数据集X{xi∈Rm,i＝1,2…N}，m表示输入数据的维数，该数据集的概率密度函数表示为：其中，Θ＝[α₁,μ₁,Σ₁；α₂,μ₂,Σ₂；……；α_k,μ_k,Σ_k]是GMM的参数，K是高斯成分的个数，θ_k为第k个高斯成分的参数，θ_k＝(μ_k,Σ_k)，μ_k和Σ_k分别为第k个高斯成分的均值和协方差矩阵，α_k为第k个高斯成分所占的比例，且0<α_k<1，其中第k个高斯成分的概率密度函数为：通过期望最大化算法对GMM方法中的未知参数进行求解，具体求解过程分为E步和M步，其描述如下：E步：根据当前第l次更新的参数和通过贝叶斯公式计算第i个训练样本属于第k个高斯成分的概率其中C_k表示第k个高斯成分M步：更新算法参数步骤4：当来到一个新的输入数据xq，采用即时学习JITL算法从历史数据集中选择与之最相似的一组数据建立局部的高斯过程回归GPR模型，JITL算法和GPR建模方法的详细描述分别如下：JITL算法：JITL方法是根据相似输入产生相似输出的思想，从训练样本中选择与当前到来的测试样本最相似的一组训练样本来建模，JITL的核心是相似度准则的选取，基于欧式距离和角度的相似度准则是一种常用的方法，即：其中，距离d表示当前到来的测试样本与训练样本之间的2范数，θ表示这两个样本之间的夹角，γ为一系数，取值在0到1之间；然而，对于一些非高斯工业过程，GMM可以较好地对过程的非高斯性进行描述，相比于传统的相似度准则，基于贝叶斯高斯混合模型BGMM的相似度准则可以更好地选择相似样本来建立GPR模型，由步骤2和3分别得到的最优的高斯成分个数K和各个成分的参数Θ，对应的相似度准则可以表示为：其中x_q表示新到来的样本，x_i表示第i个训练样本，p(C_k|x_q)表示新到来的样本x_q属于第k个高斯成分的后验概率，为两样本之间的马氏距离，针对当前到来的x_q，利用上述相似度准则，选择与x_q最相似的一组数据建立当前的GPR模型GPR建模方法：已知训练样本集X{xi∈Rm,i＝1,2…N}和Y{yi∈R,i＝1,2…N}分别代表m维输入数据和1维输出数据，输入和输出之间的关系可以表示为：yi＝f(xi)+ε (10)其中f表示一种未知的函数形式，ε表示均值为0，方差为的白噪声对于新的测试样本xq，则它的输出预测值yq也满足高斯分布，其均值和方差分别表示为：yq(xq)＝cT(xq)C‑1Y (11)其中，c(x_q)＝[c(x_q,x₁),…,c(x_q,x_N)]^T是测试输入数据与训练输入数据的协方差矩阵，为训练输入数据之间的协方差矩阵，c(x_q,x_q)表示测试输入数据与本身的协方差值；GPR选择径向基协方差函数，其函数描述如下：其中，v表示先验知识的总体度量，ωt表示每维数据相对应的权重，δij为Kronecher算子，表示各辅助变量的相对重要程度；采用极大似然估计得到式(13)中的参数其对数似然函数为：使用训练集和验证集将参数θ试凑出来，然后用共轭梯度法得到优化的参数，参数确定后，对于新的测试数据，可由式(11)得到软测量模型输出；步骤5：将新到来的样本点xq带入步骤4建立好的局部GPR模型，得到最终的估计值yq。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江南大学，未经江南大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810516991.7/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F17-00 特别适用于特定功能的数字计算设备或数据处理设备或数据处理方法
G06F17-10 .复杂数学运算的
G06F17-20 .处理自然语言数据的
G06F17-30 .信息检索；及其数据库结构
G06F17-40 .数据的获取和记录
G06F17-50 .计算机辅助设计

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于贝叶斯高斯混合模型的即时学习软测量建模方法在审

专利文献下载