[发明专利]一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法在审

申请号：	201710853390.0	申请日：	2017-09-20
公开（公告）号：	CN107657274A	公开（公告）日：	2018-02-02
发明（设计）人：	葛志强;陈革成	申请（专利权）人：	浙江大学
主分类号：	G06K9/62	分类号：	G06K9/62
代理公司：	杭州求是专利事务所有限公司33200	代理人：	邱启旺
地址：	310058 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 means 二叉 svm tree 不平衡数据工业故障分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于k-means的二叉SVM-tree不平衡数据工业故障分类方法，其特征在于，包括以下步骤：

步骤一：收集建模用的有标签训练样本，对其进行预处理和归一化，得到训练样本集X_l＝[X₁；X₂；...；X_C+1]，该有标签训练样本集包括工业过程中正常工况的数据以及各种故障工况的数据，分为C个故障工况类别和1个正常工况类别，每个类别的样本集为其中n_i为训练样本数，m为过程变量数，R为实数集；记录所述的标签训练样本集X_l＝[X₁；X₂；...；X_C+1]的所有数据的标签信息，标记正常工况标签为1，故障工况标签依次为2,...,C+1，则每个类别的标签信息为Y_i＝[i,i,...i],i＝1,2,...,C+1，完整的标签集为Y_l＝[Y₁；Y₂；...；Y_C+1]；其中，正常工况类别的数据多于故障工况类别的数据，每个故障工况类别的数据量相等，各个工况数据量的差别用不平衡度为u表征，即

步骤二：通过计算每个工况类别每个维度的平均值获得每个工况类别的中心点，得到与类别对应的中心点集为O＝[o₁,o₂,...,o_C+1]；

步骤三：将训练样本集进行拆分：使用k-means聚类方法，将中心点集O分为2个子集O₁,O₂，则，分别属于O₁,O₂包含的中心点所对应的类别的训练样本子集为D₁,D₂；

步骤四：构建树的根节点：使用SVM在D₁,D₂之间构建超平面，则树的两个分支为D₁,D₂；

步骤五：分别对D₁,D₂对应的节点重复步骤三和四的操作，再对D₁,D₂分别得到的分支对应的节点重复步骤三和四的操作，以此类推，直到每一个叶节点都只包含一个类别停止，完成SVM-tree的构建；

步骤六：利用测试样本对步骤四中构建的SVM-tree作测试，获得测试样本的标签信息。

2.根据权利要求1所述的基于k-means的二叉SVM-tree不平衡数据工业故障分类方法，所述的步骤三的具体步骤如下：

(1)首先在正常类O中选取2个初始均值向量，计算O中每个样本与这些均值向量之间的距离，并根据每个样本距离最近的均值向量确定o_j的簇标记λ_j，此处j＝1,2,...,C+1，λ_j＝1或-1；

(2)重新计算2个簇的均值向量，并选择这两个均值向量重复步骤(1)的操作；迭代至均值向量不再变化，得出最终的均值向量和O中每个元素的簇标记，将簇标记为1的中心所对应的训练样本归为D₁类，将簇标记为-1的中心所对应的训练样本归为D₂类。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江大学，未经浙江大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710853390.0/1.html，转载请声明来源钻瓜专利网。

上一篇：一种冷轧清洗段碱液消泡剂加注系统
下一篇：一种用于不锈钢表面退火酸洗后的吹干装置

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06K 数据识别；数据表示；记录载体；记录载体的处理
G06K9-00 用于阅读或识别印刷或书写字符或者用于识别图形，例如，指纹的方法或装置
G06K9-03 .错误的检测或校正，例如，用重复扫描图形的方法
G06K9-18 .应用具有附加代码标记或含有代码标记的打印字符的，例如，由不同形状的各个笔画组成的，而且每个笔画表示不同的代码值的字符
G06K9-20 .图像捕获
G06K9-36 .图像预处理，即无须判定关于图像的同一性而进行的图像信息处理
G06K9-60 .图像捕获和多种预处理作用的组合

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法在审

专利文献下载