[发明专利]一种基于增量PCA的工业监测数据分类方法有效

专利信息
申请号: 201811091469.5 申请日: 2018-09-19
公开(公告)号: CN109324595B 公开(公告)日: 2020-06-23
发明(设计)人: 谢国;张永艳;刘涵;王文卿;梁莉莉;张春丽;孙澜澜 申请(专利权)人: 西安理工大学
主分类号: G05B23/02 分类号: G05B23/02
代理公司: 北京国昊天诚知识产权代理有限公司 11315 代理人: 杨洲
地址: 710048*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 增量 pca 工业 监测 数据 分类 方法
【权利要求书】:

1.一种基于增量PCA的工业监测数据分类方法,其特征在于,包括如下步骤:

步骤1、对工业监测数据进行采集,按采样顺序排列,并记录其数据标签,将其分为训练集和测试集;

步骤2、基于增量PCA方法建立模型,分别对步骤1中的训练集和测试集进行在线降维;

步骤3、步骤2中的训练集作为数据对象建立支持向量机SVM分类模型,并通过对测试集数据进行分类验证该模型;

所述步骤1具体包括如下步骤:

步骤1.1、对工业系统中的传感器进行数据采样,假设采样数据为有标签数据,采集到的工业监测高维数据用X={x1,x2,…,xN}∈Rd×N表示,其中d表示高维数据的维数,每间隔1S进行一次采样,N表示采样数据的数目,第t个采样数据用xt表示,t∈{1,2,...,N},xt=[xt1xt2...xtd]T

步骤1.2、对采样数据进行分配,采样数据的标签信息用Y={y1,y2,...,yN}∈R1×N表示,与高维数据X一一对应,选取高维数据X和数据标签Y的前百分之八十作为训练数据集和训练标签,剩下百分之二十作为测试数据集和测试标签;

所述步骤2包括如下步骤:

步骤2.1、输入高维数据X和所需参数:离线降维目标维数k<d,在线降维目标维数l<k,w0=0;

步骤2.2、对矩阵U、矩阵Z以及各参数进行初始化:矩阵U和Z为U=0d×l,Z=0d×l,w=0,wU=0l×1

步骤2.3、进入for循环:当接收到第t个采样数据xt时,对参数w、残差rt和矩阵C进行更新,更新公式如下所示,而对于每个采样数据xt,其低维用st表示:

rt=xt-U*UT*xt

C=(I-U*UT)*Z*ZT*(I-U*UT);

步骤2.4、对初始矩阵和参数进行设置,判断是否更新矩阵C和向量rt,具体包括以下步骤:

步骤2.4.1、对初始矩阵和参数进行设置后,判断是否满足条件式在满足该条件的情况下,按顺序执行步骤2.4.2-步骤2.4.3,反之,执行步骤2.5;

步骤2.4.2、先对矩阵C进行特征值分解,其最大特征值和其相对应的特征向量分别用λ、u表示,并将特征值λ赋给(wU)u

步骤2.4.3、判断U中是否有非零列,如果有,用特征向量u代替U的第一个非0列,更新矩阵C和向量rt,更新公式如下:

C=(I-U*UT)*Z*ZT*(I-U*UT);

rt=xt-U*UT*xt

步骤2.5、由于rt的更新,矩阵Z会随之更新,具体更新过程如下;

步骤2.5.1、先对矩阵Z进行转置,矩阵Z的第l行用Zl表示,并用rt替换矩阵Z的第l行Zl,其它行元素不变;

步骤2.5.2、再对矩阵Z进行SVD分解,即[U11,V1]←SVD(Z),Σ1为奇异矩阵,其中的奇异值从大到小排列;

步骤2.5.3、按照公式C1=Σ1V1和进行运算,其中Σl,l表示奇异值矩阵中最小的奇异值;

步骤2.5.4、按照公式进行计算,其中Σ2表示对奇异值矩阵中的所有奇异值和零元素进行平方运算,矩阵规模大小不变;

步骤2.5.5、输出更新后的矩阵Z:再次对Z进行转置;

步骤2.6、低维输出:对于矩阵U中每一个非零列u,其元素按公式(wU)u=(wU)u+xt,u2更新,(wU)u为向量wU在u方向上的投影,并进行低维输出st=UT*xt,并结束for循环;

所述步骤3包括如下步骤:

步骤2中将高维数据进行降维,降维之后用S={s1,s2,…,sN}表示,其中st为l维向量,t=1,2,…,N,在步骤3中,将降维后的数据S采样个数的前百分之八十作为训练集的输入数据,其对应的标签作为训练标签,代入传统的支持向量机SVM模型并进行训练,剩下百分之二十作为测试数据集,输入训练完成的SVM模型,其输出是测试数据集的标签,并将真实数据标签与测试数据集的标签进行比较,从而可以判断该模型是否有效;

步骤3.1、将训练数据作为输入,训练标签作为输出,训练分类模型,根据方程|wx+b|=1建立两边支持向量,该算法在训练过程中需要满足支持向量间距离尽可能大,这样可以对采样数据实现有效分类;

步骤3.2、根据方程wx+b=0在两支持向量中间寻找最优超平面,最优超平面可以保证将不同类别的采样数据通过最优超平面分类;

步骤3.3、如果采样数据线性不可分,则通过选取核函数将采样数据映射到更高维的特征空间中,这样在高维空间中映射的采样数据就可以满足线性可分;

步骤3.4、模型训练完成后通过计算得到最优的w和b,即最优超平面,将测试数据集代入,并输出其测试标签。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811091469.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top