[发明专利]随机森林算法结合激光诱导击穿光谱检测金属元素的方法在审
申请号: | 201910274617.5 | 申请日: | 2019-04-08 |
公开(公告)号: | CN109884033A | 公开(公告)日: | 2019-06-14 |
发明(设计)人: | 李华;王甜;贺瑶;李茂刚 | 申请(专利权)人: | 西安石油大学 |
主分类号: | G01N21/71 | 分类号: | G01N21/71;G06K9/62 |
代理公司: | 西安汇恩知识产权代理事务所(普通合伙) 61244 | 代理人: | 张伟花 |
地址: | 710065 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 随机森林 测试集 激光诱导击穿光谱 含油污泥 算法结合 校正集 小波 变量重要性 光谱数据 金属元素 预测 光谱数据采集 激光诱导击穿 准确度 定量测定 光谱仪器 基体效应 算法校正 误差验证 预测结果 金属铜 检测 准确率 建模 算法 位点 噪声 样本 测量 金属 | ||
本发明提供了一种随机森林算法结合激光诱导击穿光谱检测金属元素的方法,该方法为用激光诱导击穿光谱仪器在含油污泥样品不同测量位点光谱数据采集,分为校正集和测试集,选取最优的小波滤噪方法对校正集和测试集光谱数据小波滤噪,再变量重要性提取,寻找预测结果最优的阈值,建立随机森林算法校正集模型,用OOB误差验证准确性,预测经处理后的测试集的含油污泥样本中的金属含量。本发明将随机森林算法结合激光诱导击穿光谱定量测定含油污泥样品中尤其是有毒金属铜、锌、铬和镍的方法,随机森林算法能克服基体效应的干扰,小波滤噪处理校正集和测试集的光谱数据克服信号中噪声和提高预测准确度,变量重要性提取能提高预测准确率,缩短建模时间。
技术领域
本发明属于光谱分析技术领域,具体涉及一种随机森林算法结合激光诱导击穿光谱检测金属元素的方法。
背景技术
在石油的开采、再加工和运输过程中往往会发生漏油、回收利用不完全等问题,会造成土壤、水资源和空气污染,特别是土壤污染。随着石油工业的发展,在原油的生产、运输、储存和炼制过程中都会产生大量的含油污泥。它是石油工业产生的固体废物之一,是各种多环芳烃(PHCs)、水、有毒金属和固体颗粒物等物质的混合物。根据中国环境标准(GB5085.7-2007)规定,含油污泥属于危险固体废物。如果含油污泥在排放前没有达到国家规定的排放标准,含油污泥中的有毒金属会通过食物链逐渐富集起来,然后通过食物存储在人体器官中,造成慢性中毒,危害人体健康。所以,快速分析含油污泥中有毒金属的浓度对含油污泥的处理、迁移、改善、监测和修复都具有重要意义。
激光诱导击穿光谱(laser-induced breakdown spectroscopy,LIBS)是20世纪发展起来的一种新兴的原子发射分析光谱技术,具有分析快捷、多元素同时分析以及无需样品预处理等优势,因此,LIBS技术被认为是最有前途的分析手段之一。近年来,LIBS技术广泛应用于环境污染、过程分析、科技考古、太空探测等领域,尤其在冶金领域具有很大的应用潜力。因此被著名的光谱分析学家J.Winfordner誉为“未来的一颗巨星”。
激光诱导击穿光谱的定量分析方法主要指校准方法和无校准(CF)方法。曲线校准法是最简单、应用最广泛的校准方法之一,它构建了元素分析线的积分强度或强度比(分析线与参考线)与一组校准样本已知浓度之间的关系。但是,标定曲线始终是单变量的,其回归模型是利用单个特征线的强度和被测元素的相应浓度建立的,其分析结果易受激光能量波动、样品不均匀性和复杂基体效应的影响。由于含油污泥是一个复杂的基体,在测量的过程中样品的化学成分测量结果容易受到多种基体效应的影响,而常规的单变量校准模型无法消除这些干扰因素的影响。多元校正分析方法是消除复杂样本矩阵效应的有效工具。目前,定量分析的多元校正算法包括:主成分分析(PCA)、人工神经网络(ANN)、支持向量机(SVM)、和极限学习机等。随机森林算法(Random Forest,简称RF)是一种重要的基于Bagging的集成学习方法,可以用来做分类、回归等问题,在LIBS的定量分析中得到了成功的应用。在机器学习中,RF是一种统计学习理论,提取重复采样方法进行回归分析。在光谱定性和定量中RF算法得到了一定应用。
发明内容
本发明所要解决的技术问题在于针对上述现有技术的不足,提供一种随机森林算法结合激光诱导击穿光谱检测金属元素的方法,该方法将随机森林算法结合激光诱导击穿光谱定量测定含油污泥样品中金属,尤其是有毒金属铜、锌、铬和镍的方法,随机森林算法能够克服基体效应等因素的干扰,通过小波滤噪处理校正集和测试集的光谱数据,能够很好的克服信号中的噪声,有效提高预测准确度,进一步进行变量重要性提取后不仅可以提高预测准确率,还大大的缩短了建模所需的时间,具有较强的泛化能力。
为解决上述技术问题,本发明采用的技术方案是:一种随机森林算法结合激光诱导击穿光谱检测金属元素的方法,包括以下步骤:
步骤一、利用激光诱导击穿光谱仪器分别在若干个不同的含油污泥样品的不同测量位点进行光谱数据采集;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安石油大学,未经西安石油大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910274617.5/2.html,转载请声明来源钻瓜专利网。