[发明专利]基于修改聚类半监督核主元分析的早期故障检测方法有效
申请号: | 201711324889.9 | 申请日: | 2017-12-13 |
公开(公告)号: | CN108182302B | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 张颖伟;于忠源;方正 | 申请(专利权)人: | 东北大学 |
主分类号: | G06F30/20 | 分类号: | G06F30/20 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 梁焱 |
地址: | 110169 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 修改 聚类半 监督 核主元 分析 早期 故障 检测 方法 | ||
1.一种基于修改聚类半监督核主元分析的早期故障检测方法,其特征在于:包括以下步骤:
步骤1:采集冶炼工业过程中的传统数据与多媒体流数据,包括:冶炼初期即完全正常状态的数据、冶炼过程中数据、喷炉故障发生前后数据,并对采集的正常和故障数据进行标记,得到标记样本数据其标签矩阵为C为类别总数,其它数据作为无标记数据,得到未标记样本数据其中xi∈RD、xj∈RD,N=nl+nu,D表示xi、xj的数据维数,nl表示标记样本数,nu表示未标记样本数;提取采集的多媒体流数据中的关键帧,并提取多媒体流数据的色彩与灰度特征,并将传统数据与多媒体流数据统一进行标准化处理和坐标变换,得到采样样本数据;
步骤2:用步骤1标准化后的采样样本,通过建立基于类成员的半监督分类模型,即SSCCM模型,得到未标记样本的标签成员资格,进而找出早期故障数据;具体方法为:
步骤2.1:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立基于类成员的半监督分类模型即SSCCM模型,在再生希尔伯特空间采用(f,v)交替迭代的方法求解该模型,得到决策函数f和标签成员资格函数v;具体方法为:
步骤2.1.1:计算标记样本数据与未标记样本数据的邻域加权平均值,分别为和其中和分别表示第i个标记数据样本和第j个未标记数据样本的邻域加权平均值,分别如下两式所示;
其中,i′=1,2,…,nl;j′=1,2,…,nu;Ne(xi)、Ne(xj)分别表示xi、xj在欧式空间通过k-近邻得到的邻域集;Sii′、Sjj′分别表示随xi与xi′距离增加而单调递减的权值量、随xj与xj′距离增加而单调递减的权值量,Sii′=exp(-||xi-xi′||2),Sjj′=exp(-||xj-xj′||2);
步骤2.1.2:采用修改聚类假设,根据邻域学习准则约束每个样本与其邻域加权平均值共享相同的标签成员向量,建立SSCCM模型如下式所示;
其中,f表示决策函数;vk(xn)为样本xn的标签成员资格函数v(xn)的第k个元素,表示样本xn属于第k类的可能性;对于标记样本xi,其标签成员资格函数v(xi)为定值,如果标记样本xi属于第k类,则vk(xi)=1;其余元素为0;f(xn)表示样本xn的函数决策值;rk表示类别编码向量,C个类的编码矩阵为rk的第k个元素为1,其余元素为0;当标记样本xi属于第k类时,令yi=rk,即标签与类编码都是C维向量,且yi的第k个元素为1,其余元素为0;表示样本xn的邻域加权平均值的函数决策值;λ和λs是正则化参数,b是标签成员资格的加权指数;
步骤2.1.3:为了找出早期故障数据,采用二分类方式,用以区分正常与故障数据,令公式(1)中的类别总数C=2;
步骤2.1.4:在再生希尔伯特空间,采用(f,v)交替迭代的方法,求解SSCCM模型,得到决策函数f和标签成员资格函数v;具体方法为:
每个样本xn的在核空间的邻域加权平均值被定义为通过表达定理,决策函数形式变换为每个βn∈R2×1,所以解的形式如下式所示;
其中,β=[β1,β2,...,βN]∈R2×N,为表达定理的系数向量;Y表示标签数据的标签向量yi构成的矩阵,K表示所有样本的核矩阵,Iu是nu×nu的单位矩阵;表示未标记数据的类标签成员概率值,是一个对角矩阵,其对角元素是V的按行排列的所有元素的平方值;
对于固定的决策函数f(x),SSCCM问题将变为对标签成员资格函数求解问题,如下式所示;
求解上式得到任意样本x的第k个标签成员资格函数为:
步骤2.2:根据决策函数f和标签成员资格函数v找出早期故障数据,使用如下互补的两种方法进行判定:
(1)对于处于决策边界附近的样本x,检验其决策函数f(x)与标签成员资格函数v(x)的一致性,如果两者不一致,则判断x为早期故障点;
(2)对于处于决策边界附近的样本x,判定两侧的标签成员资格函数v1(x)与v2(x)之差是否小于标签成员函数的选择系数ε,即|v1(x)-v2(x)|<ε,0≤ε≤1;
对于上述两种方法判定出的相同的早期故障点数据,取其中之一,综合得到所有的早期故障数据;
步骤3:将步骤2得到的早期故障数据重新作为未标记数据数据个数为m;将步骤1中的标记数据和步骤2中已经明确划分类别的数据重新作为标记数据标签值矩阵为yl为第l个标记数据的标签值,Y′∈Rr,数据个数为M;考虑早期故障数据的变化信息,并基于修改的聚类假设,建立修改聚类假设的半监督KPCA故障检测模型,进行第二次分类,找到早期故障数据中偏向主元的分界线fD;修改聚类假设的半监督KPCA故障检测模型如式(6)所示;
其中,Y0与Y1是新标记的正常与故障两类数据的标签值,与新的标记数据标签值应一致;v0与v1分别表示正常和故障两类标签成员资格概率值,λl和λu是新的标记数据与新的未标记数据的权衡参数;s是方差约束控制参数;
步骤4:对冶炼工业过程进行在线故障检测与诊断;
将新采集的多媒体流数据按步骤1采用的方法进行标准化处理,得到新样本xnew,利用步骤3得到的二次分界线fD,判定xnew的类别,如果判定为故障类,则认为该冶炼工业过程发生故障;否则,继续步骤4处理下一个新样本信息。
2.根据权利要求1所述的基于修改聚类半监督核主元分析的早期故障检测方法,其特征在于:所述步骤3中进行第二次分类,找到早期故障数据中偏向主元的分界线fD的方法为:在对(f,v)求解的过程中,采用(f,v)交替迭代的方法,每一步都得到闭合解,具体步骤为:
步骤3.1:根据表达定理,将公式(6)中的目标函数变换为下式:
其中,t0,t1∈Rm分别是m维列向量,t0内的所有元素值均为Y0,t1内的所有元素值均为Y1,K表示所有数据的核矩阵,KM表示K中取标记数据的M行,Km表示K中取未标记数据m行,αD为表达定理的系数向量,采用αD的投影算子,迫使αD投影到之前所有解的零空间内,令A=[α1,...,αD-1]是之前所有解构成的矩阵,之后通过奇异值分解使S=Null(KAATK)作为KA零空间的N×(N-n+1)的正交基;通过投影SαD,得到N-n+1维问题;均为m维对角矩阵,其对角元素分别是v0(xu)、v1(xu)的平方值,其中u=1,...,m;c表示的是拉格朗日算子;ED为m维方阵,其中每一元素的值为
步骤3.2:令L′偏导数为零,求解式(7)并通过耦合形式变换得到:
其中,P=ST(KmTKm-KmTEDKm)S,
步骤3.3:通过求解下式所示的广义特征值问题,得到式(12)中的c,由此便得到αD;
步骤3.4:对于一个固定的决策函数,其标签成员资格函数求解将变为下式:
令L″对v0(xu)和v1(xu)求偏导数并等于零,即
又由于式(6)中约束的第一项v0(xu)+v1(xu)=1,则得到
在求取决策函数时,c<δ,δ是Gx=δPx的最小广义特征值,由于αDTPαD在c∈[-∞,δ) 是严格递增的,因此当满足αDTPαD-s2=0时,解是唯一的;通过Gx=δPx确定控制参数s的上界,即当c=δ时;
通过以上的求解,得到对于早期故障数据二次分类所得的分界线fD。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711324889.9/1.html,转载请声明来源钻瓜专利网。