[发明专利]基于重采样的集成特征选择算法的生产线故障判断方法有效
申请号: | 201910412165.2 | 申请日: | 2019-05-17 |
公开(公告)号: | CN110297469B | 公开(公告)日: | 2022-02-18 |
发明(设计)人: | 乔非;朱雪初;孙晓彬 | 申请(专利权)人: | 同济大学 |
主分类号: | G05B19/418 | 分类号: | G05B19/418 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 赵继明 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 采样 集成 特征 选择 算法 生产线 故障 判断 方法 | ||
1.一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,包括以下步骤:
步骤1:基于重采样方法将不均衡数据集IDS构建新的样本子空间;
步骤2:使用随机森林算法对各样本子空间进行特征选择,获取各子空间的特征子集;
步骤3:将各子空间的特征子集合并成新的特征空间合集;
步骤4:使用降噪自编码器对新的特征空间合集进行降维,得到预测模型的输入;
步骤5:根据预测模型的输入采用随机森林算法建立故障预测模型并利用该故障预测模型对生产线进行实时故障监控判断;
所述步骤1包括以下分步骤:
步骤11:根据半导体制造系统生产线的监控系统获得生产线各传感器实时监控参数数据;
步骤12:对样本数据进行数据预处理,填补空缺值及离群点检测,得到不均衡数据集IDS;
步骤13:随机从不均衡数据集IDS所分成的正负两类样本中有放回的抽取样本点并重新构造N个正负比a:b的样本子空间;
所述步骤2包括以下分步骤:
步骤21:利用随机森林算法对各样本子空间进行属性选择并对各样本子空间中所有特征的重要性数值f进行排队;
步骤22:选出各样本子空间中重要性数值f满足设定条件的特征,得到各样本子空间对应的特征子集。
2.根据权利要求1所述的一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,所述正负比a:b为20:50。
3.根据权利要求1所述的一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,所述步骤22中的设定条件为f0。
4.根据权利要求1所述的一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,所述步骤4包括以下分步骤:
步骤41:对新的特征空间合集进行噪声化,将新的特征空间合集中设定百分比的数据置0,得到新的样本空间合集;
步骤42:针对新的特征空间合集和新的样本空间合集构建神经网络映射关系;
步骤43:对神经网络映射关系中的参数进行优化并得到满足误差的神经网络映射关系,利用降噪自编码器输入层到输出层之间的神经网络架构得到新的特征空间合集降维到X维后的特征空间合集。
5.根据权利要求4所述的一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,所述步骤43中的X为20,所述步骤41中的设定百分比为5%。
6.根据权利要求5所述的一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,所述步骤42中的神经网络映射关系,其描述公式为:
y=s(Wx+b)
式中,y表示新的特征空间合集的特征,W和b表示神经网络映射关系参数,s表示sigmoid函数,x表示新的样本空间合集的特征。
7.根据权利要求1所述的一种基于重采样的集成特征选择算法的生产线故障判断方法,其特征在于,所述步骤5包括以下分步骤:
步骤51:抽取训练子集随机森林中的N1棵决策树的生成需对应N1个训练子集;所述训练子集通过bootstrap抽样技术从预测模型的输入中的原始训练集得到;
步骤52:每棵决策树分别经过选取随机特征变量和节点分裂过程开始生长;
步骤53:生成随机森林对每棵树不进行剪枝,使其最大限度地生长,最终所有决策树组成随机森林,并以该随机森林作为故障预测模型;
步骤54:将样本输入故障预测模型的分类器中,对于每个样本每棵决策树都输出对应的预测值并对其类别进行投票,最终投票数最多的一类为该样本最终确定的类别,该最终确定的类别对应的故障类型即为故障监控判断结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910412165.2/1.html,转载请声明来源钻瓜专利网。