[发明专利]基于集成增量的动态权重组合的设备故障分类方法在审
申请号: | 201910377438.4 | 申请日: | 2019-05-04 |
公开(公告)号: | CN110334580A | 公开(公告)日: | 2019-10-15 |
发明(设计)人: | 王志杰;冯海领;赵宜斌;赵宇 | 申请(专利权)人: | 天津开发区精诺瀚海数据科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 石家庄知住优创知识产权代理事务所(普通合伙) 13131 | 代理人: | 林艳艳 |
地址: | 300401 天津市北辰*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 动态权 重组合 记忆神经网络 设备故障 支持向量机模型 故障诊断技术 滚动轴承设备 经验模式分解 设备故障诊断 分类准确性 支持向量机 动态调整 分类模型 故障诊断 快速动态 模型应用 涉及设备 特征提取 小波去噪 增量模型 增量学习 支持向量 数据处理 非平衡 分类器 分类 权重 重构 机组 研究 | ||
1.一种基于集成增量的动态权重组合的设备故障分类方法,其特征在于,包括如下步骤:
(1)采集设备运行正常时和故障时的信号数据,使用基于过采样和欠采样融合的数据抽样模型对信号数据进行非平衡处理;
(2)针对非平衡处理之后的信号数据,使用小波包去噪,去除信号数据中的噪声点,然后使用小波包重构,将去噪之后的信号数据重构为原始信号;
(3)针对步骤(2)重构之后的原始信号,使用极点对称模态分解完成原始信号的特征参数提取,将特征向量作为训练数据集,并将训练数据集划分为多组,一组作为初步训练数据集输入到步骤(4),剩余组分次作为增量训练集;
(4)训练长短期记忆神经网络,将初步训练集映射到输入层,通过LSTM网络训练参数,再输入到softmax输出层得到分类类别的概率分布,在训练次数达到预设值并且代价函数逐步收敛时停止训练;
(5)利用初步训练集对多分类支持向量机进行训练;
(6)利用新的支持向量机调整步骤(4)和步骤(5)的长短期记忆神经网络和支持向量机组合模型中的权重,完成组合模型的训练;
(7)针对增量数据集,先进行步骤(1)-(3)处理完成特征参数的提取,然后将处理后的特征参数作为测试集放入步骤(6)训练好的组合模型中处理;若输出结果符合预期,则输出,若输出结果不满足预期要求,则利用新增特征参数进行步骤(6)完成权重调整完成集成增量学习。
2.根据权利要求1所述的基于集成增量的动态权重组合的设备故障分类方法,其特征在于,步骤(1)所述的非平衡数据处理的具体步骤如下:
(1)构造少数类样本:将样本集分为少数类样本和多数类样本,对于少数类样本x,在核空间上寻找x的k个近邻样本;然后根据K个样本中少数类样本与多数类样本数量划分x的样本种类;
1)安全样本:即样本集中少数类样本数量大于或等于多数类样本数量;
2)边界样本:即样本集中少数类样本数量小于多数类样本数量;
3)噪音样本:即样本集中只存在多数类样本;
针对1)和2)类型的数据,在其k个样本中随机选择2个样本,在3个样本之间按照一定规则合成N个新样本,其中N值是向上采样倍率;
若选中的两个样本y1和y2是多数类样本,利用以下公式生成N个样本:
①根据y1和y2生成N个临时样本tj(j=1,2,..,N):
tj=y1+rand(0,0.5)*(y2-y1);
②根据tj和x生成新的少数类样本Xj(j=1,2,...,N):
Xj=x+rand(0,1)*(tj-x);
若选中的两个样本y1和y2中有少数类样本,利用以下公式生成N个样本:
①根据y1和y2生成N个临时样本tj(j=1,2,..,N):
tj=y1+rand(0,1)*(y2-y1);
②根据tj和x生成新的少数类样本Xj(j=1,2,...,N):
Xj=x+rand(0,1)*(tj-x);
针对3)类型的数据,为使噪音数据引起的风险降低,故将N设置为1;同时在少数类样本中随机选择一个少数类y,使用以下公式随机生成新样本;
X=x+rand(0.5,1)*(y-x)
在求取K近邻时,先使用非线性映射函数将样本映射到核空间,在核空间中样本之间的距离被称为核距离,其计算公式为:
其中,是非线性映射函数,K(x,y)是核函数,在这里使用的核函数为高斯核函数;公式为:
(2)基于K近邻的Tomek links欠采样模型:针对少数类和多数类样本,在k近邻的基础上将少数类样本划分成不同类别的数据,从而减少Tomeklinks算法计算的样本数量,提高欠采样的样本效率;
①根据第(1)步中的样本类别划分方法将第(1)步合成的样本集重新划分成少数类样本和多数类样本,对少数类样本中的每个样本求取k近邻,根据k近邻中多数类样本和少数类样本数量划分样本类别为安全样本、边界样本和噪音样本,类别判断标准如第(1)步所示;
②去除噪音样本;
③假设少数类样本中边界样本集为D,多数类样本集为U,其中U的数量为N;
fori=1,2,…,N
④多数类样本集U中x1与边界样本集D中x2之间的距离为d=d(x1,x2);
⑤多数类样本集U中x1与合成的样本集中的每个样本计算距离得到距离数据集F,如果d<F,返回x1所在行;
⑥循环结束,删除返回行的样本集;合并多数类样本集U与少数类样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津开发区精诺瀚海数据科技有限公司,未经天津开发区精诺瀚海数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910377438.4/1.html,转载请声明来源钻瓜专利网。