[发明专利]基于修改聚类半监督核主元分析的早期故障检测方法有效

申请号：	201711324889.9	申请日：	2017-12-13
公开（公告）号：	CN108182302B	公开（公告）日：	2021-06-22
发明（设计）人：	张颖伟;于忠源;方正	申请（专利权）人：	东北大学
主分类号：	G06F30/20	分类号：	G06F30/20
代理公司：	沈阳东大知识产权代理有限公司 21109	代理人：	梁焱
地址：	110169 辽***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于修改聚类半监督核主元分析早期故障检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于修改聚类半监督核主元分析的早期故障检测方法，其特征在于：包括以下步骤：

步骤1：采集冶炼工业过程中的传统数据与多媒体流数据，包括：冶炼初期即完全正常状态的数据、冶炼过程中数据、喷炉故障发生前后数据，并对采集的正常和故障数据进行标记，得到标记样本数据其标签矩阵为C为类别总数，其它数据作为无标记数据，得到未标记样本数据其中x_i∈R^D、x_j∈R^D，N＝n_l+n_u，D表示x_i、x_j的数据维数，n_l表示标记样本数，n_u表示未标记样本数；提取采集的多媒体流数据中的关键帧，并提取多媒体流数据的色彩与灰度特征，并将传统数据与多媒体流数据统一进行标准化处理和坐标变换，得到采样样本数据；

步骤2：用步骤1标准化后的采样样本，通过建立基于类成员的半监督分类模型，即SSCCM模型，得到未标记样本的标签成员资格，进而找出早期故障数据；具体方法为：

步骤2.1：采用修改聚类假设，根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量，建立基于类成员的半监督分类模型即SSCCM模型，在再生希尔伯特空间采用(f,v)交替迭代的方法求解该模型，得到决策函数f和标签成员资格函数v；具体方法为：

步骤2.1.1：计算标记样本数据与未标记样本数据的邻域加权平均值，分别为和其中和分别表示第i个标记数据样本和第j个未标记数据样本的邻域加权平均值，分别如下两式所示；

其中，i′＝1,2,…,n_l；j′＝1,2,…,n_u；Ne(x_i)、Ne(x_j)分别表示x_i、x_j在欧式空间通过k-近邻得到的邻域集；S_ii′、S_jj′分别表示随x_i与x_i′距离增加而单调递减的权值量、随x_j与x_j′距离增加而单调递减的权值量，S_ii′＝exp(-||x_i-x_i′||²)，S_jj′＝exp(-||x_j-x_j′||²)；

步骤2.1.2：采用修改聚类假设，根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量，建立SSCCM模型如下式所示；

其中，f表示决策函数；v_k(x_n)为样本x_n的标签成员资格函数v(x_n)的第k个元素，表示样本x_n属于第k类的可能性；对于标记样本x_i，其标签成员资格函数v(x_i)为定值，如果标记样本x_i属于第k类，则v_k(x_i)＝1；其余元素为0；f(x_n)表示样本x_n的函数决策值；r_k表示类别编码向量，C个类的编码矩阵为r_k的第k个元素为1，其余元素为0；当标记样本x_i属于第k类时，令y_i＝r_k，即标签与类编码都是C维向量，且y_i的第k个元素为1，其余元素为0；表示样本x_n的邻域加权平均值的函数决策值；λ和λ_s是正则化参数，b是标签成员资格的加权指数；

步骤2.1.3：为了找出早期故障数据，采用二分类方式，用以区分正常与故障数据，令公式(1)中的类别总数C＝2；

步骤2.1.4：在再生希尔伯特空间，采用(f,v)交替迭代的方法，求解SSCCM模型，得到决策函数f和标签成员资格函数v；具体方法为：

每个样本x_n的在核空间的邻域加权平均值被定义为通过表达定理，决策函数形式变换为每个β_n∈R^2×1，所以解的形式如下式所示；

其中，β＝[β₁,β₂,...,β_N]∈R^2×N，为表达定理的系数向量；Y表示标签数据的标签向量y_i构成的矩阵，K表示所有样本的核矩阵，I_u是n_u×n_u的单位矩阵；表示未标记数据的类标签成员概率值，是一个对角矩阵，其对角元素是V的按行排列的所有元素的平方值；

对于固定的决策函数f(x)，SSCCM问题将变为对标签成员资格函数求解问题，如下式所示；

求解上式得到任意样本x的第k个标签成员资格函数为：

步骤2.2：根据决策函数f和标签成员资格函数v找出早期故障数据，使用如下互补的两种方法进行判定：

(1)对于处于决策边界附近的样本x，检验其决策函数f(x)与标签成员资格函数v(x)的一致性，如果两者不一致，则判断x为早期故障点；

(2)对于处于决策边界附近的样本x，判定两侧的标签成员资格函数v₁(x)与v₂(x)之差是否小于标签成员函数的选择系数ε，即|v₁(x)-v₂(x)|＜ε，0≤ε≤1；

对于上述两种方法判定出的相同的早期故障点数据，取其中之一，综合得到所有的早期故障数据；

步骤3：将步骤2得到的早期故障数据重新作为未标记数据数据个数为m；将步骤1中的标记数据和步骤2中已经明确划分类别的数据重新作为标记数据标签值矩阵为y_l为第l个标记数据的标签值，Y′∈R^r，数据个数为M；考虑早期故障数据的变化信息，并基于修改的聚类假设，建立修改聚类假设的半监督KPCA故障检测模型，进行第二次分类，找到早期故障数据中偏向主元的分界线f_D；修改聚类假设的半监督KPCA故障检测模型如式(6)所示；

其中，Y₀与Y₁是新标记的正常与故障两类数据的标签值，与新的标记数据标签值应一致；v₀与v₁分别表示正常和故障两类标签成员资格概率值，λ_l和λ_u是新的标记数据与新的未标记数据的权衡参数；s是方差约束控制参数；

步骤4：对冶炼工业过程进行在线故障检测与诊断；

将新采集的多媒体流数据按步骤1采用的方法进行标准化处理，得到新样本x_new，利用步骤3得到的二次分界线f_D，判定x_new的类别，如果判定为故障类，则认为该冶炼工业过程发生故障；否则，继续步骤4处理下一个新样本信息。

2.根据权利要求1所述的基于修改聚类半监督核主元分析的早期故障检测方法，其特征在于：所述步骤3中进行第二次分类，找到早期故障数据中偏向主元的分界线f_D的方法为：在对(f,v)求解的过程中，采用(f,v)交替迭代的方法，每一步都得到闭合解，具体步骤为：

步骤3.1：根据表达定理，将公式(6)中的目标函数变换为下式：

其中，t₀,t₁∈R^m分别是m维列向量，t₀内的所有元素值均为Y₀，t₁内的所有元素值均为Y₁，K表示所有数据的核矩阵，K_M表示K中取标记数据的M行，K_m表示K中取未标记数据m行，α_D为表达定理的系数向量，采用α_D的投影算子，迫使α_D投影到之前所有解的零空间内，令A＝[α₁,...,α_D-1]是之前所有解构成的矩阵，之后通过奇异值分解使S＝Null(KAA^TK)作为KA零空间的N×(N-n+1)的正交基；通过投影Sα_D，得到N-n+1维问题；均为m维对角矩阵，其对角元素分别是v₀(x_u)、v₁(x_u)的平方值，其中u＝1,...,m；c表示的是拉格朗日算子；E_D为m维方阵，其中每一元素的值为