[发明专利]基于协同训练偏最小二乘模型的工业过程软测量建模方法有效
申请号: | 201510266557.4 | 申请日: | 2015-05-22 |
公开(公告)号: | CN104914723B | 公开(公告)日: | 2018-10-16 |
发明(设计)人: | 包亮;葛志强 | 申请(专利权)人: | 浙江大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种可用的训练样本个数较少的条件下工业生产过程的软测量研究方法,用于在建模数据较少条件下的软测量建模并实现对于产品信息的预测。本发明利用基于协同训练的偏最小二乘学习方法,建立了一个有效的线性预测模型,并克服了工业生产过程采样数据过少的情况下模型精度不高的问题,提高了针对该过程建立的模型预测准确率和性能,从而使得工业生产过程更加可靠,产品质量更加稳定。 | ||
搜索关键词: | 基于 协同 训练 最小 模型 工业 过程 测量 建模 方法 | ||
【主权项】:
1.一种基于协同训练偏最小二乘模型的工业过程软测量建模方法,其特征在于,包括以下步骤:(1)利用集散控制系统以及离线检测方法,收集工业生产过程的数据组成建模用的训练样本集;对于收集到的训练样本集,一部分为既包含主导变量数据也包含辅助变量信息的样本集D∈RK×J,其中,所述D为有标签数据集,K为采样数据点个数,J为变量个数,R为实数集;另一部分为只包含辅助变量数据的样本集X∈RN×2M,其中,所述X为无标签数据集,N为采样数据点数,2M为辅助变量个数,将这些数据存入历史数据库;(2)对于每个生产批次的有标签数据,沿着时间点方向对每一个数据矩阵进行排列,得到新的数据矩阵,并对其进行预处理和归一化,即使得各个过程变量的均值为零,方差为1,得到新的数据矩阵集为(3)基于得到的二维数据矩阵按照主导变量和辅助变量分类标准,选取其中的主导变量作为预测目标因变量集选取其中的辅助变量作为自变量集则该二维数据矩阵可以重新描述为:(4)对于有标签数据集,对其自变量集进行均分,前一半自变量作为第一自变量视图:后一半自变量作为第二自变量视图:得到两组新的有标签数据集以及并按照同样的变量拆分方法对于无标签数据进行拆分,得到两组新的无标签数据集和(5)首先,利用建立初始的模型PLS1,利用建立初始的模型PLS2,然后,不断迭代使用无标签数据更新模型训练数据,该步骤具体为:先对建立初始的模型PLS1:对X和Y进行中心化,即使各个变量的均值为0,方差为1,得到一组新的数据E0,F0,并记录其均值与方差分别为Mx,Sx,My,Sy;然后,分别提取两变量组的第一对成分,使之相关性最大:假设从两组变量分别提出第一对成分为t1和u1,其中t1是自变量集X的线性组合,u1是因变量集Y的线性组合,由E0,F0计算第一对成分的得分向量,记为和则有:第一对成分t1和u1的协方差可以用第一对成分的得分向量和的内积来计算,故而有:此时,只需要计算M×M矩阵的最大特征值及其对应的特征向量,且的最大特征值即为θ1的平方,相应的单位特征向量即为所求解的w1,而v1可以由得到;接下来,建立y1,y2…yL对于和x1,x2…xM对于的回归:其中,记则残差矩阵为如果残差矩阵F1中元素的绝对值近似为0,则认为用第一个成分建立的回归式精度已经满足要求了,可以停止抽取成分,否则则用残差矩阵E1,F1代替E0,F0重复进行上述步骤即可;假设最终共提取了r个成分,则有:此时,得出Y的预测结果为Y=t1β1+…+trβr,将tk=wk1x1+…+wkMxM,k=1,2…r代入得到L个因变量的偏最小二乘回归方程式:yj=bj1x1+…+bjMxM,j=1,2…,L记回归系数矩阵为此时,记此模型在原有的训练集上的均方误差为RMSEorig;对于无标签数据集,对于每个样本点SULa,att1:xatt1,i,i=1,2…N,利用Mx,Sx对其进行标准化,即由得到一组新的数据集将此N个样本点逐个添加到PLS1的训练集中去,每次可以训练得到一个新的PLS1模型,每个新的PLS1模型在原有的训练集上都可以得到一个新的均方误差RMSE,分别记为RMSEi,i=1,2…N;分别计算这N个均方误差RMSE与RMSEorig的差值:RMSEdif,i=RMSEorig‑RMSEi,i=1,2…N,若所有RMSEdif,i均小于0,则认为已经达到终止条件,停止迭代,否则,取使得RMSEdif,i最大的新加标签样本作为置信度最高的样本,亦即yj=xj×BT,将样本xj对应的第二视图信息及其预测值yj作为新的有标签样本(xatt2,j,yj)添加到PLS2的训练集中去,更新PLS2的训练集,并从无标签数据集中剔除样本点xj;(6)将建模数据和各个模型参数存入历史数据库和实时数据库中备用;(7)收集新的过程数据,并对其进行预处理和归一化;(8)采用基于协同训练算法的偏最小二乘方法对工业过程的变量进行预测,实现过程监控与控制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510266557.4/,转载请声明来源钻瓜专利网。
- 上一篇:一种一体化家庭智能安全监控系统
- 下一篇:一种多信号源自学习时间同步系统