[发明专利]一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法在审
申请号: | 201710853390.0 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107657274A | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 葛志强;陈革成 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州求是专利事务所有限公司33200 | 代理人: | 邱启旺 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法,该方法在每一个树节点处对该节点所包含类别的中心点进行k‑means聚类,分为两个类别,然后使用SVM方法在这两个类别训练一个超平面,即将这个节点分出两个分支,重复使用该方法,直到每个叶节点只包含一个类别。该方法较常规的“one‑to‑all”、“one‑to‑one”等方法训练精度高,计算复杂度低,且更适合于不平衡类数据的分析处理。 | ||
搜索关键词: | 一种 基于 means 二叉 svm tree 不平衡 数据 工业 故障 分类 方法 | ||
【主权项】:
一种基于k‑means的二叉SVM‑tree不平衡数据工业故障分类方法,其特征在于,包括以下步骤:步骤一:收集建模用的有标签训练样本,对其进行预处理和归一化,得到训练样本集Xl=[X1;X2;...;XC+1],该有标签训练样本集包括工业过程中正常工况的数据以及各种故障工况的数据,分为C个故障工况类别和1个正常工况类别,每个类别的样本集为其中ni为训练样本数,m为过程变量数,R为实数集;记录所述的标签训练样本集Xl=[X1;X2;...;XC+1]的所有数据的标签信息,标记正常工况标签为1,故障工况标签依次为2,...,C+1,则每个类别的标签信息为Yi=[i,i,...i],i=1,2,...,C+1,完整的标签集为Yl=[Y1;Y2;...;YC+1];其中,正常工况类别的数据多于故障工况类别的数据,每个故障工况类别的数据量相等,各个工况数据量的差别用不平衡度为u表征,即步骤二:通过计算每个工况类别每个维度的平均值获得每个工况类别的中心点,得到与类别对应的中心点集为O=[o1,o2,...,oC+1];步骤三:将训练样本集进行拆分:使用k‑means聚类方法,将中心点集O分为2个子集O1,O2,则,分别属于O1,O2包含的中心点所对应的类别的训练样本子集为D1,D2;步骤四:构建树的根节点:使用SVM在D1,D2之间构建超平面,则树的两个分支为D1,D2;步骤五:分别对D1,D2对应的节点重复步骤三和四的操作,再对D1,D2分别得到的分支对应的节点重复步骤三和四的操作,以此类推,直到每一个叶节点都只包含一个类别停止,完成SVM‑tree的构建;步骤六:利用测试样本对步骤四中构建的SVM‑tree作测试,获得测试样本的标签信息。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710853390.0/,转载请声明来源钻瓜专利网。