[发明专利]一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法在审
申请号: | 201710853390.0 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107657274A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 葛志强;陈革成 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 means 二叉 svm tree 不平衡 数据 工业 故障 分类 方法 | ||
1.一种基于k-means的二叉SVM-tree不平衡数据工业故障分类方法,其特征在于,包括以下步骤:
步骤一:收集建模用的有标签训练样本,对其进行预处理和归一化,得到训练样本集Xl=[X1;X2;...;XC+1],该有标签训练样本集包括工业过程中正常工况的数据以及各种故障工况的数据,分为C个故障工况类别和1个正常工况类别,每个类别的样本集为其中ni为训练样本数,m为过程变量数,R为实数集;记录所述的标签训练样本集Xl=[X1;X2;...;XC+1]的所有数据的标签信息,标记正常工况标签为1,故障工况标签依次为2,...,C+1,则每个类别的标签信息为Yi=[i,i,...i],i=1,2,...,C+1,完整的标签集为Yl=[Y1;Y2;...;YC+1];其中,正常工况类别的数据多于故障工况类别的数据,每个故障工况类别的数据量相等,各个工况数据量的差别用不平衡度为u表征,即
步骤二:通过计算每个工况类别每个维度的平均值获得每个工况类别的中心点,得到与类别对应的中心点集为O=[o1,o2,...,oC+1];
步骤三:将训练样本集进行拆分:使用k-means聚类方法,将中心点集O分为2个子集O1,O2,则,分别属于O1,O2包含的中心点所对应的类别的训练样本子集为D1,D2;
步骤四:构建树的根节点:使用SVM在D1,D2之间构建超平面,则树的两个分支为D1,D2;
步骤五:分别对D1,D2对应的节点重复步骤三和四的操作,再对D1,D2分别得到的分支对应的节点重复步骤三和四的操作,以此类推,直到每一个叶节点都只包含一个类别停止,完成SVM-tree的构建;
步骤六:利用测试样本对步骤四中构建的SVM-tree作测试,获得测试样本的标签信息。
2.根据权利要求1所述的基于k-means的二叉SVM-tree不平衡数据工业故障分类方法,所述的步骤三的具体步骤如下:
(1)首先在正常类O中选取2个初始均值向量,计算O中每个样本与这些均值向量之间的距离,并根据每个样本距离最近的均值向量确定oj的簇标记λj,此处j=1,2,...,C+1,λj=1或-1;
(2)重新计算2个簇的均值向量,并选择这两个均值向量重复步骤(1)的操作;迭代至均值向量不再变化,得出最终的均值向量和O中每个元素的簇标记,将簇标记为1的中心所对应的训练样本归为D1类,将簇标记为-1的中心所对应的训练样本归为D2类。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710853390.0/1.html,转载请声明来源钻瓜专利网。