[发明专利]一种基于随机森林的多信息融合回转窑产品质量分类识别方法有效
申请号: | 202110240838.8 | 申请日: | 2021-03-04 |
公开(公告)号: | CN113033620B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 王欣;秦斌;高振洋;秦羽新 | 申请(专利权)人: | 湖南工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/774;G06V10/764;G06V10/80;G06N3/04;G06T5/00;G06T7/90 |
代理公司: | 北京风雅颂专利代理有限公司 11403 | 代理人: | 曾志鹏 |
地址: | 412007 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 随机 森林 信息 融合 回转 产品质量 分类 识别 方法 | ||
1.一种基于随机森林的多信息融合回转窑产品质量分类识别方法,以期能够将图像分类识别技术与关键位置的温度进行多信息融合,有效的提高模型的鲁棒性和回转窑产品质量分类结果准确率,同时实现了人机物多信息融合的网络信息控制系统;分两个阶段,实现如下:
阶段一:设计基于改进卷积神经网络LeNet-5分类模型,过程如下:
步骤1、获取回转窑火焰图像,通过机器视觉实验平台在某工业回转窑现场进行RGB图像采集,按照烧成带的状态分为正烧结、过烧结、欠烧结三类,数据集分训练集和测试集;
步骤2、有效特征提取;
步骤2.1、对图像数据进行归一化处理;
步骤2.2、对数据集进行数据增强;
步骤2.3、图像预处理包括图像通道分离处理、高斯滤波降噪、图像分量合并处理3个部分,将RGB彩色图像分量化转化为R、G、B三通道并分别进行高斯滤波处理后再合并回RGB彩色图像;高斯滤波的计算方法为:
式中x’,y’为像素点,σ是标准差,G(x’,y’)是经高斯滤波处理后的数据;
步骤3、卷积神经网络LeNet-5模型改进
步骤3.1、激活函数采用ReLu函数来代替Sigmoid函数;
步骤3.2、损失函数为交叉熵损失函数并设置学习率;
步骤3.3、在每次更新参数时使用Dropout技术在训练过程中对神经元进行一定比率的随机断开;
步骤3.4、将卷积神经网络两种池化方法合二为一,形成均值-最大池化方法;
步骤4、确定训练次数并通过测试集进行数据测试,使LeNet-5模型识别准确率趋于稳定,交叉熵损失趋于稳定;
阶段二、采用随机森林的多信息融合进行回转窑产品质量分类,具体算法实现如下:
步骤1、通过阶段1获取回转窑产品基于图像的质量分类结果;
步骤2、窑头温度、烧成带温度、窑尾温度以及窑尾负压四种关键过程数据的采样、滤波及归一化;
步骤3、数据特征同步序列化
步骤3.1、对不同的烧成带图像特征提取过程和关键过程数据采集在时间上进行特征同步序列化,关键过程数据具有不同的滞后时间Γi,i=1,2,3,4,和检测时间Ti,i=1,2,3,4,烧成带图像特征提取时间为Te,则设定的同步周期时间为Ts>max{Te,Ti+Γi};
步骤3.2、两部分在同一周期内进行,得到的信息进行融合;
步骤4、采用算术平均滤波方法来对关键过程数据进行滤波,步骤如下:
在某一时刻t,根据数据形式选取不同采样次数N;
计算采样数据x(k)的滤波值y(t):
算术平均滤波得到的数据x”,通过Mapminmax函数来对数据进行归一化处理;由下式得出:
式中x”min为数据x内的最小值,x”max为数据x”内的最大值,x”*为归一化后的数据;
步骤5、随机森林模型训练调参
步骤5.1、确定决策树的数量ntree;随着决策树的数量增加,模型袋外数据分类错误率EOOB总体呈现下降趋势,当ntree>13时,分类错误率EOOB趋于平稳,低至0.3%;通过网络搜索方法GridSearchCV确定ntree使获得的分数最高;
步骤5.2、确定最优特征数目mtree;由于产品质量总共分为五类,则通过遍历法来确定最优特征数目;当最优特征数目为mtree时,模型平均误差达到最小;通过网络搜索方法GridSearchCV确定mtree使获得的分数最高;
步骤5.3、通过网络搜索方法确定最大深度max_depth使获得分数最高;
步骤5.4、通过网络搜索方法确定叶子节点最小样本数min_samples_leaf使获得分数最高;
步骤5.5、通过网络搜索方法确定叶子中间节点最小分裂样本数min_samples_split使获得分数最高;
步骤6、按随机森林思想,确定基于多信息融合的回转窑产品质量分类步骤
步骤6.1、以烧成带图像特征提取结果、窑头温度、烧成带温度、窑尾温度、窑尾负压作为特征,将产品质量划分为5个级别;并以此建立样本集X{x1,x2,x3,x4,x5,yi},其中x1~x5为5项特征,yi,i=1,2,…5为目标分类级别,即产品质量划分;
步骤6.2、利用Bootstraping法对样本集X进行随机有放回地抽取,得到p个训练子集;
步骤6.3、根据选择的p个训练子集中的数据特点确定决策树的数目ntree和最优特征数目mtree,mtree≤5;
步骤6.4、用遍历法按照公式(4)使平均误差率Eave最小以及网络搜索GridSearchCV方法来共同来确定最优特征数目mtree:
mtree=min{Eave} (4)
通过模型袋外数据分类错误率EOOB的稳定程度以及网络搜索GridSearchCV方法来共同确定决策树的数量ntree;EOOB的计算方法如下:假设带外样本总数为A,将这A个样本带入先前生成的随机森林分类器,有A个输出结果,计算其中错误分类的数目为B,则公式如下所示:
步骤6.5、在决策树生长过程中的每次节点分裂时,都采用从最优特征数目mtree个特征中按Gini系数最小原则选择最优特征进行分支生长;始终按照这样的方式来生成余下的决策树,且在生长过程中不进行剪枝处理;
步骤6.6、当随机森林模型建立后,输入测试数据集让每棵决策树对其进行测试,得到各自的分类标识;
步骤6.7、随机森林模型对全部决策树获得的分类结果,采用投票的方式来确定最终烧成带级别;投票公式如下所示:
上式中H(xT)是组合分类结果;xT为待测数据;hi(xT)表示第i颗决策树模型;q是决策树的总数;yi为目标分类;I(·)为示性函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南工业大学,未经湖南工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110240838.8/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置