[发明专利]一种基于集成学习的产品质量控制方法在审
申请号: | 201810281599.9 | 申请日: | 2018-04-02 |
公开(公告)号: | CN108764597A | 公开(公告)日: | 2018-11-06 |
发明(设计)人: | 傅予力;李凯鑫;张勰;吴宗泽;张莉婷 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/04;G06K9/62;G06F17/50 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 李斌 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 集成学习 产品质量控制 生产过程 质量控制 关键质量指标 可调整参数 参数分析 传统产品 调整参数 工程分析 工程构建 工业数据 可调参数 模型融合 模型设计 生产流程 使用机器 数据分析 特征联系 注塑工艺 良品率 构建 预设 进度 挖掘 预测 发现 学习 | ||
1.一种基于集成学习的产品质量控制方法,其特征在于,所述的产品质量控制方法包括下列步骤:
S1、基于注塑工艺数据的数据分析,根据注塑工艺参数,分析混合型变量、特征判别性、数据分布;
S2、特征工程分析与构建,过程如下:
S21、明确特征使用方案,即预测不同生产进度下产品关键质量指标;
S22、特征清洗,剔除部分异样样本;
S23、特征处理,包括类别变量处理、数值型变量处理、时序状态监控指标数据处理,其中,类别变量处理是对类别型变量在输入模型前进行编码处理;数值型变量处理是对取值只含有有限几种的数值型变量当成类别型变量进行编码处理,但保留原始数值,对于其他数值变量保持原值,对于缺失值,用中值填充处理;时序状态监控指标数据处理是对时序指标数据通过分时间阶段提取各个参数的统计值,包括均值、中值、众数、最大和小值、方差;
S24、特征选择,从时序状态指标数据中提取特征,进行嵌入式的特征选择方法,选择树模型XGBoost和随机森林的模型设计方法,通过利用树模型XGBoost得到特征重要性,并对特征进行排序,剔除重要性低的特征,降低特征维数;
S3、基于集成学习的模型设计,将评测指标通过预测值和实际值的RMSE值的算术均值作为评估标准,在模型训练过程中,关于分类模型,通过K交叉验证作为评估方法,选择AUC作为性能度量方法;关于回归模型,选择K交叉验证作为评估方法,选择RMSE作为性能度量方法;
S4、数据不平衡处理,具体为:
S41、数据与算法层面:
S411、通过对不平衡的时间序列模型做组合抽样,对多的样本集进行抽样,与少的样本集组合成新的样本,针对新的样本集合进行模型训练,最后进行Bagging;
S412、选择XGBoost算法和DART算法;
S413、通过采用代价敏感学习方法对样本集进行模型训练,在XGBoost算法中,对不同类别的数据采取不同的惩罚系数;
S414、采用引入深度学习的树模型Dart,并引入深度学习的Dropout方法进行处理防止模型过拟合;
S42、模型融合层面,分类模型和回归模型相融合:对于关键质量指标预测,通过回归模型预测出每一批次的产品关键质量指标,由于数据不平衡特点,对未处理的少样本数据当做小类别,采用分类模型进行模型预测,最终采用分类和回归方法共用的方式进行数据处理;
S5、多模型融合处理,具体为:
S51、回归模型融合采用加权平均的方法;
S52、分类模型融合采用两个二分类模型,模型训练完成后,对测试集进行预测,得到每个样本key_index低于0.92或者高于0.98的概率,将置信度高的样本的预测值,限定为0.92或者0.98。
2.根据权利要求1所述的一种基于集成学习的产品质量控制方法,其特征在于,所述的产品质量控制方法还包括下列步骤:
R2、明确特征使用方案,即对生产过程中工艺参数进行最优预设值推荐,以取得较好的关键质量指标,具体如下:
R21、整体的工艺可调整参数推荐,具体为:
挖掘出使得良品率最大的最佳参数组合,对参数组合进行分组,得到训练数据中所有出现的参数组合,并计算每种组合的良品率的均值、中值、最大值、最小值以及每种组合出现的次数,得到统计表,按照良品率均值从大到小排序,对Top20/30/40参数组合中的每个可调参数进行累加,找出每个可调参数的众数值作为推荐;
R22、针对特定的工艺不可调整参数,对工艺可调参数进行推荐,具体为:
首先从训练数据里筛选出良品率大于一定阈值的产品批次,以这些产品批次的参数作为候选值;然后对于新的产品批次,以工艺不可调参数表作为特征,从候选样本里找出与之最相似或Top k个最相似的样本,取其可调参数作为推荐。
3.根据权利要求2所述的一种基于集成学习的产品质量控制方法,其特征在于,所述的步骤R21、整体的工艺可调整参数推荐中,对于double型的可调参数,取中值或者均值作为推荐。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810281599.9/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理