[发明专利]一种基于深度随机森林的钢板板形异常识别方法在审
申请号: | 201911356131.2 | 申请日: | 2019-12-25 |
公开(公告)号: | CN111126490A | 公开(公告)日: | 2020-05-08 |
发明(设计)人: | 刘强;常学敏 | 申请(专利权)人: | 东北大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 随机 森林 钢板 异常 识别 方法 | ||
1.一种基于深度随机森林的钢板板形异常识别方法,其特征在于,包括下述步骤:
步骤1:对厚板生产过程中剪切线工艺后的第k块钢板进行厚度采样测量,得到第k块钢板的厚度数据集Hk={hk(i,j),i∈{1,2,...,M},j∈{1,2,...,Nk}},并采集第k块钢板的板形质量标签yk;
其中,k∈{1,2,...,S},S为钢板的总块数,hk(i,j)为第k块钢板在采样点(i,j)处的厚度,i为钢板宽度方向上的采样点序号,j为钢板长度方向上的采样点序号,M为钢板宽度方向上的采样点总数,Nk为第k块钢板长度方向上的采样点总数,Nk与第k块钢板的长度成正比;钢板故障类型yk∈{0,1,2},yk=0代表第k块钢板出现除中浪以外故障的钢板,yk=1代表第k块钢板是无异常的钢板,yk=2代表第k块钢板是出现中浪故障的钢板;
步骤2:对钢板数据进行预处理;
步骤2.1:计算第k块钢板的初始相对厚度数据集Ck={ck(i,j),i∈{1,2,...,M},j∈{1,2,...,Nk}};其中,ck(i,j)为第k块钢板在采样点(i,j)处的相对厚度,为第k块钢板的目标厚度;
步骤2.2:对于第k块钢板长度方向上的采样点总数Nk,将其处理为同样长度的采样点数L,则第k块钢板进行采样点处理后的相对厚度数据集变为Ck={ck(i,j),i∈{1,2,...,M},j∈{1,2,...,L}};当第k块钢板长度方向上的采样点总数Nk>L时,对其采用B样条插值的下采样,将第k块钢板长度方向上的采样点总数Nk采样成L个采样点;当第k块钢板长度方向上的采样点总数Nk<L时,对其采用B样条插值的上采样,将第k块钢板长度方向上的采样点总数Nk采样成L个采样点;当第k块钢板长度方向上的采样点总数Nk=L时,直接取其采样点总数L;
步骤2.3:将第k块钢板进行采样点处理后的相对厚度数据集Ck={ck(i,j),i∈{1,2,...,M},j∈{1,2,...,L}}归一化处理,归一化处理后的相对厚度数据集中0≤ck(i,j)≤1;
步骤3:构造钢板板形质量样本集C={C1,C2,.C.k,..C.S.},其中Ck={ck(i,j),i∈{1,2,...,M},j∈{1,2,...,L}},其中S为钢板总数,构造钢板板形相对厚度数据集对应的标签集Y={y1,y2,...,yk,...,yS},yk为表征第k块钢板的质量标签,yk∈{0,1,2};
步骤4:从钢板板形质量样本集C中选取样本构成训练样本集R,以表征钢板的相对厚度的数据集作为特征矩阵和实际生产工艺中通过工作人员识别进行分类定义的标签作为输入,钢板的板形质量标签为输出,利用训练样本集R构建并训练基于深度森林的钢板板形质量异常识别模型;
步骤5:对厚板生产工艺剪切线工艺后的待检测钢板进行厚度采样测量,得到待检测钢板的厚度数据集,采用步骤2至步骤3方法,计算待检测钢板的相对厚度数据集,对相对厚度数据集进行上采样或下采样得到同样长度方向的采样点,并且对相对厚度数据集进行归一化,得到表征待检测钢板的相对厚度的特征向量Dtest,将Dtest输入训练后的钢板板形质量异常识别模型,输出待检测钢板的板形质量标签。
2.根据权利要求1所述的一种基于深度随机森林的钢板板形异常识别方法,其特征在于:所述步骤4具体包括:
步骤4.1:划分数据集,将钢板板形质量样本集C划分为训练集R、验证集V以及测试集T三部分;
其中,训练集R用于模型的构建;验证集V在模型的构建过程中用于验证模型,辅助模型的构建,防止出现过度拟合;测试集T用于检测模型的构建,用于评估模型准确率,测试模型的泛化能力;
步骤4.2:搭建准确分类钢板板形的深度随机森林模型网络:
步骤4.2.1:判断输入特征是否为高维度,是否在时间或者空间上具有约束关系;若输入特征具备以上任一特征性,则选择在架构模型时,首先将原始输入特征经过多窗口扫描结构,将多窗口扫描结构得到的特征向量输入下一个结构级联结构,再进行异常识别;否则直接进入步骤4.2.3,进行异常识别;
步骤4.2.2:多窗口扫描结构:原始输入特征向量为E=S*M*L,其中S为钢板总数,M为钢板宽度方向上的采样点总数,L为钢板长度方向上经过上采样或下采样得到的一致的采样点总数;窗口扫描维度为q*q,经过滑动窗口扫描后,得到N=S*[(M-q+1)*(L-q+1)]个q*q的特征矩阵;
定义决策树组成的森林,选择s1种不同类型的随机森林,每一种类型森林为l个,即一共有n1=s1*l个森林,将窗口扫描N个q*q的特征矩阵输入森林,得到N*n1个3维类向量,其中3为厚板分类标签为yk∈{0,1,2}三类;
将这N*n1个3维的类向量连接起来,即得到比原始输入的特征向量维度更高的特征向量E=N*n1*3维;
步骤4.2.3:若是未满足输入特征满足高维度,或在时间或空间上有约束关系的任一约束条件,则可以不使用多窗口扫描结构,直接将原始特征向量E=S*M*L作为级联结构的输入;
级联森林的每一层都是由决策树组成的森林构成,将特征向量输入级联层An,其中,n表示森林所属层数,每一层森林都由不同类型的随机森林组成,An={f1*g1,f2*g2,...,ft*gt},其中,ft表示第t种随机森林,gt表示第t种随机森林的个数,ft={r1,r2,...,rm},其中,t表示第t种随机森林,m表示第t个森林里决策树的总数;
输入到级联森林的特征向量E,经过第一层森林,特征向量转换为E1=n*l*3+E维度,然后作为下一层的输入特征向量,直到最后一层级联An,因为决策树是在特征空间中不断划分子空间,并且给每个子空间打上标签,每一个森林输出三维的类向量,即每个森林的每棵决策树会根据样本所在的子空间中训练样本的类别占比生成一个类别的概率分布hp={(x1%,y1%,z1%),(x2%,y2%,z2%),...,(xm%,ym%,zm%)},其中,p表示第p个随机森林,m表示第p个森林里决策树的总数,xm%表示第一个类别的概率,ym%表示第二个类别的概率,zm%表示第三个类别的概率,然后对森林内所有树的各类比例取平均其中fp表示第p个随机森林的输出三维类向量,xp%表示第p个随机森林输出的第一个类别的概率,yp%表示第p个随机森林输出的第二个类别的概率,zp%表示第p个随机森林输出的第三个类别的概率,得到整个森林对各类的比例,最后对所有的森林输出的各类比例取平均,其中,w表示最后一层级联的随机森林的总数,再对其取最大值,MAX=max{F}=max{(x%,y%,z%)},得到概率最大的类别;
为了降低过拟合与欠拟合风险,每个森林产生的类向量由K折交叉验证产生,具体来说,每个实例都将被用作K-1次训练数据,产生K-1个类向量,然后对其取平均值以产生作为级联中下一级的增强特征的最终类向量,在扩展一个新的级后,整个级联的性能将在验证集上进行估计,如果没有显著的性能增益,训练过程将终止;因此,级联中级的数量是自动确定的;
步骤4.3:用训练集R进行模型训练,调节超参数,同时在保存的深度随机森林模型中用验证集V进行模型验证测试,增加模型的泛化能力,经过训练调参,提高模型精确度;
步骤4.4:将精确度达到历史最高的训练模型进行保存,然后将测试数据集T作为模型输入,模型输出的测试集标签与原人工标签进行对比,得到模型的测试精确度,测试模型的泛化能力,检验模型对于新数据的分类能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911356131.2/1.html,转载请声明来源钻瓜专利网。