[发明专利]一种基于集成学习的注塑机堵料异常检测方法在审

专利信息
申请号: 201810790797.8 申请日: 2018-07-18
公开(公告)号: CN109145948A 公开(公告)日: 2019-01-04
发明(设计)人: 贝毅君;刘二腾;何伟;钟钊瑜;祝耀;吴连秋 申请(专利权)人: 宁波沙塔信息技术有限公司
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 315000 浙江省宁*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 注塑机 堵料 特征值提取 基分类器 集成学习 强分类器 异常分类 异常检测 构建 检测 数据预处理 工作电压 时域特征 使用寿命 特征数据 异常状况 原始数据 特征列 投票法 样本库 原有的 采集 发现
【权利要求书】:

1.一种基于集成学习的注塑机堵料异常检测方法,其特征在于,该方法包括以下步骤:

1)原始数据采集

将模块电压采集器安装到注塑机的各个工作模块上,并在设定时长内定时采集各个工作模块上的工作电压作为原始数据存储到数据库中;

2)数据预处理

对数据库中存储的各工作模块在指定工作时间内的工作电压各组数据依次采用数据清洗方法、数据归一化方法预处理;

3)特征值提取

对步骤2得到预处理后的数据提取特征值,组成带有时域特征(均值、方差、标准差、中位数、峰值、谷值)的数据集,并存储到数据集文件中;

4)生成数据集正、负样本

将数据文件中的新数据集分成堵料异常数据集和正常工作数据集,并采用合成少数类过采样技术(SMOTE)增加堵料异常情况的数据集,平衡数据集中的正、负样本;

5)构建堵料异常分类器

在步骤4的基础上构建二级分类器,第一级为三个基分类器,第二级为一个分类器,第一级的三个基分类器分别为Logistic分类器、SVM分类器和决策树分类器,第二级分类器为Logistic分类器。

2.根据权利要求1所述的一种基于集成学习的注塑机堵料异常检测方法,其特征在于,所述步骤1中在设定时长区间内定时地采集注塑机各个工作模块的电压数据时,需要实时记录注塑机生产的产品状况,一旦出现堵料异常的时间段标记为1,其余正常工作标记为0。

3.根据权利要求2所述的一种基于集成学习的注塑机堵料异常检测方法,其特征在于,所述步骤2中的数据清洗方法为对各个工作模块的各组数据中存在的异常值、噪声值、冗余值进行剔除,并计算各组数据的均值,将该均值替换原来的异常值和噪声值;所述数据归一化方法是先计算各组数据的标准差,再将各组数据的每个数据减去该组数据的均值,然后除以该组数据集的标准差,将数据映射到[0,1]区间之内。

4.根据权利要求2或3所述的一种基于集成学习的注塑机堵料异常检测方法,其特征在于,所述步骤3在步骤2的基础上进行特征值提取,提取方法为:提取各个工作模块内设定时间长度内的各组电压数据,通过每组数据内工作电压组内数据相加并处以组内数据的个数得到均值;将组内工作电压数据减去均值得到结果进行先平方后相加,然后再除以组内数据个数得到方差;将方差开根号得到标准差;再在每组数据集中找到中位数、峰值、谷值,每个工作模块得到一组均值、方差、标准差、中位数、峰值、谷值的数据集保存到数据集文件中。

5.根据权利要求4所述的一种基于集成学习的注塑机堵料异常检测方法,其特征在于,所述步骤4的正、负样本数据集的生成包括以下流程:

a.遍历数据集文件,将堵料异常情况的数据集单独提出,生成堵料异常的负样本数据集文件;将工作状态正常的数据集提出,生成正常工作的负样本数据集文件,并将该两项数据集文件保存到数据集文件中;

b.在堵料异常的数据集文件中,随机取出设定比例的异常情况作为异常子集,并对异常子集进行分析,然后根据异常子集样本人工合成新的样本添加到数据集中,该新数据集被用作样本以训练分类模型。

6.根据权利要求5所述的一种基于集成学习的注塑机堵料异常检测方法,其特征在于,步骤5中构建堵料异常分类器包括以下步骤:

A.构建Logistic分类器,使用随机梯度上升算法求得最佳系数向量,包括以下流程:

a.加载数据库文件,从数据集文件中提取处特征值数据集文件和正、负样本数据集文件;

b.将提取的特征值数据集文件和正、负样本数据集文件随机打乱,按照7:3的比例分成四个特征部分:训练集特征、测试集特征、训练集目标、测试集目标;

c.将流程b中的训练集特征和训练集目标转为矩阵类型;

d.构件基于随机梯度上升算法的Logistic分类器,设定上升步长、迭代次数、初始化系数向量,随后对系数向量在迭代次数下进行梯度上升求得最佳系数向量;

e.使用测试集特征和测试集目标对训练模型进行精度验证。

B.构建SVM分类器,采用径向基核函数将特征值进行映射,采用交叉验证,选择最佳参数C(惩罚因子)和g(核函数的gamma值),用最佳参数C和g对整个训练集训练得到SVM模型,具体流程如下:

a.加载数据库文件,从数据集文件中提取处特征值数据集文件和正、负样本数据集文件;

b.将流程a中的也真数据集和正、负样本数据集随机打乱,按照7:3的比例分成四个特征部分:训练集特征、测试集特征、训练集目标、测试集目标;

c.选择径向基核函数(rbf)构件SVM分类器,选择特定取件的C和g组合,在训练集特征和训练集目标上找到C和g使SVM分类器精度最高的组合;

d.使用测试集热证和测试集目标对训练模型进行精度验证;

C.构建决策树分类器,根据基尼指数最小化原则,对特征进行选取,构建CART决策树分类器,具体流程如下:

a.加载数据库文件,从数据集文件中提取处特征值数据集文件和正、负样本数据集文件;

b.将流程a中的特征数据集和分类数据集随机打乱,按照7:3的比例分为四个部分:分别是训练集特征、测试集特征、训练集目标、测试集目标;

c.导入决策树分类器,利用训练集特征和训练集目标生成决策树模型,在测试集特征和测试集目标上验证模型的分类精度;

d.采用CCP(Cost Complexity Pruning)方法对步骤c)中的决策树模型进行剪枝,从原始决策树T0开始生成子树序列{T0,T1,.......Tn},其中Ti+1Ti产生,Tn为根节点;

D.将步骤A、B、C步骤中构建的分类器的结果作为新增列增加到原有的数据集中,生成新的数据集作为输入传入到第二极的Logistic分类器中,第二极Logistic分类器中为了避免过拟合,采用K折交叉验证的方法进行模型的训练,具体流程如下:

a.将训练集分成K份;

b.选择其中一份作为测试集,其余作为训练集,进行模型训练;

c.重复步骤b),选择测试精度最优的模型作为最终的第二级分类器模型。

将第二级Logistic分类器的结果作为最终结果进行输出。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于宁波沙塔信息技术有限公司,未经宁波沙塔信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810790797.8/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top