[发明专利]一种基于分层随机森林的变量重要性分析方法有效

专利信息
申请号: 202010030606.5 申请日: 2020-01-13
公开(公告)号: CN111260201B 公开(公告)日: 2023-04-28
发明(设计)人: 何飞;王立东;胡宇星;张志研 申请(专利权)人: 北京科技大学
主分类号: G06Q10/0639 分类号: G06Q10/0639;G06F18/214;G06N20/00
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 张仲波;邓琳
地址: 100083*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 分层 随机 森林 变量 重要性 分析 方法
【说明书】:

发明提供一种基于分层随机森林的变量重要性分析方法,包括以下步骤:获取待处理数据集,所述待处理数据集中的每个样本具有多个变量;对所述待处理数据集进行预处理,剔除异常样本和空值;对预处理后的数据集,将其中的变量按照加工工序进行分组;有放回随机抽样生成多个训练集,为每一个训练集建立分层决策树;将多棵分层决策树融合形成分层随机森林模型;利用Morris筛选法或Gini指数法结合分层随机森林模型进行变量重要性分析,生成变量重要性排序。本发明方法解决了现有技术中的常规质量建模方法不考虑多工序生产过程的问题,能够很好地体现多工序加工过程的先后作用,提高了模型的准确性和可解释性。

技术领域

本发明涉及流程工业质量管控与优化技术领域,特别涉及一种基于分层随机森林的多工序流程工业的变量重要性分析方法。

背景技术

在生产过程中,需要建立一个良好的数学模型来对整个生产流程进行整体分析,从而可以得到高质量良好的产品。然而几乎所有生产过程都会有多道加工工序,所以得到的数据包含多工序加工信息。

在实际生产过程中,需要找到对其影响最大的若干变量,从而进行质量分析。因此,需要利用变量重要性分析来寻找这若干个最影响产品质量波动的最重要的工艺变量。实际生产过程可能包含多道加工工序,例如冶金、石化等流程钢材生产过程包含多道加工工序,然而现有的常规模型无法很好地解释多工序生产过程。

发明内容

本发明的目的在于提供一种基于分层随机森林的变量重要性分析方法,解决现有技术中的常规质量建模方法不考虑多工序生产过程的问题,提高变量重要性分析的可解释性。

为解决上述技术问题,本发明的实施例提供如下方案:

一种基于分层随机森林的变量重要性分析方法,包括以下步骤:

S1、获取待处理数据集,所述待处理数据集中的每个样本具有多个变量;

S2、对所述待处理数据集进行预处理,剔除异常样本和空值;

S3、对预处理后的数据集,将其中的变量按照加工工序进行分组;

S4、抽样生成多个训练集,为每一个训练集建立分层决策树;

S5、将多棵分层决策树融合形成分层随机森林模型;

S6、利用Morris筛选法或Gini指数法结合分层随机森林模型进行变量重要性分析,生成变量重要性排序。

优选地,在所述步骤S1中,获取待处理数据集的方法为采用原始数据集或在原始数据集上随机抽取。

优选地,所述步骤S2还包括:

使用SMOTE过采样方法消除正常样本和异常样本的不平衡问题。

优选地,所述步骤S3包括:

将上游的化学成分变量作为第一工序的变量,将下游的工艺变量作为第二工序的变量,进行分组。

优选地,所述步骤S4包括:

利用Bootstrap抽样方法,采用多次有放回随机抽样技术从原始样本中抽取预定数量的样本,生成多个训练集。

优选地,在对分层决策树的每个节点进行最佳变量选择时,并非全体变量参与选择,而是从全体变量中随机选择若干个变量参与选择。

优选地,对于多个训练集,首先对第一组变量利用最小化准则进行划分,得到第一层及其叶节点,然后以第一层的叶节点作为下一层的根节点,对下一组变量进行划分,最终建立分层决策树。

优选地,所述步骤S6包括:

对于连续质量问题,利用Morris筛选法结合分层随机森林模型对多工序加工过程进行变量重要性分析,利用基效应的绝对值均值来衡量变量的重要性。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京科技大学,未经北京科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010030606.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top