[发明专利]一种近红外光谱的多模型建模方法有效
申请号: | 201310537968.3 | 申请日: | 2013-10-31 |
公开(公告)号: | CN103528990B | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 卞希慧;张彩霞;刘巍;谭小耀;郭玉高;王秋男 | 申请(专利权)人: | 天津工业大学 |
主分类号: | G01N21/359 | 分类号: | G01N21/359 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300160 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 红外 光谱 模型 建模 方法 | ||
技术领域
本方法发明属于分析化学领域的无损分析技术,特别涉及一种近红外光谱建模方法。
背景技术
复杂样本的定量分析一直是分析化学领域及工业生产中极具挑战性的问题。复杂样本一般基体复杂、组分繁多,传统的分析方法难以适用于复杂样本组分的定量分析,亟待发展新的、快速的定量分析技术。近红外光谱是一种无损分析技术,以其分析速度快、样本预处理简单、稳定性好等优点而在众多的分析方法中脱颖而出,广泛应用于农业、石油化工、医药、食品等领域。然而,由于近红外光谱谱带重叠现象严重,信号吸收较弱,且背景干扰严重等问题,必须借助于化学计量学方法才能进行定量分析。在近红外光谱定量分析中,建立一个预测未知样本组分浓度的可靠的定量模型是最重要的任务,因此,需要进一步研究建模方法。
在近红外光谱定量分析中,常用于建模的方法有多元线性回归(MLR)、主成分回归方法(PCR)、偏最小二乘回归(PLS)、人工神经网络(ANN)、支持向量回归(SVR)等。由于近红外光谱检测到的信号除样品信息外,还有噪声、背景等干扰信息,并且并不是所有的光谱信息都是有用信息,由此发展了一系列预处理以及波长选择技术,前者有标准正态变量(SNV)、多元散射校正(MSC)、SG平滑、一阶或二阶导数、正交信号校正(OSC)、连续小波变换(CWT)等,后者有遗传算法(GA)、无信息变量消除(UVE)、蒙特卡罗-无信息变量消除(MC-UVE)、随机检验-偏最小二乘(RT-PLS)等。然而这些传统的建模方法仅产生单个校正模型,即采用一定的训练集建立一个最优模型用于预测,当训练集样本数目有限或测定组分含量较低时,单模型建模方法的预测精度与稳定性往往不能令人满意。然而,在许多情况下,模型的预测精度至关重要,近年来,起源于机器学习领域的多模型建模技术,受到了学者的广泛关注。多模型建模就是从同一训练集中产生多个训练子集,然后利用这些训练子集建立多个子模型分别进行预测,并将多个预测结果通过一定的集成方法,形成一个最终结果。这种方法利用多个子模型协同的方式提升了预测模型精度,稳健性以及稳定性。
Bagging和boosting是两种典型的多模型算法。Bagging中训练子集的样本是随机选择的,各训练子集间相互独立,并行生成,子模型没有权重,最终的预测结果采用简单平均的方式集成,该方法可以减小模型的预测方差。而boosting样本选择与前轮训练有关,训练子集不独立,顺序生成,子模型权重不同,最终的预测结果采用权重中位值的方式集成。该方法不仅可以减小模型的预测方差,还可以减少模型的预测偏差。自从Massart等(参见:Zhang M H,Xu Q S,Massart D L.Boosting partial least squares.Anal Chem,2005,77:1423~1431)将boosting PLS方法引入到分析化学领域后,近年来在化学计量学领域发展了一系列基于bagging和boosting的多模型建模方法,如bagging PLS、bagging KPLS、boosting KPLS、boosting SVR、boostingANN等,用于烟草样本、土壤样本、谷物样本、发酵过程和QSAR研究中,并且都取得了比单一模型更好的预测结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津工业大学,未经天津工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310537968.3/2.html,转载请声明来源钻瓜专利网。