[发明专利]一种近红外光谱的多模型建模方法有效
申请号: | 201310537968.3 | 申请日: | 2013-10-31 |
公开(公告)号: | CN103528990B | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 卞希慧;张彩霞;刘巍;谭小耀;郭玉高;王秋男 | 申请(专利权)人: | 天津工业大学 |
主分类号: | G01N21/359 | 分类号: | G01N21/359 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 300160 *** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种近红外光谱多模型建模方法,把采集的近红外光谱及对应的被测成分浓度数据分成训练集和预测集;利用boosting方法对训练集进行重采样,一开始赋予所有波长点相同的取样权重,从中选取一定数目的波长点建立PLS子模型;通过PLS子模型的得分和载荷乘积得到预测光谱;利用预测光谱和建模子集光谱的差值的指数损失函数对训练子集的每个波长点赋予权重;下次选取波长点时,权重越大的样本取样概率越大;重复以上步骤,建立多个子模型;通过这些模型预测结果的加权平均值作为预测集样本的预测浓度值。该方法通过从波长方向建立子模型,采用boosting方法不断进行训练最终建立多模型,提高了定量分析模型的预测精度,为近红外光谱多元校正分析提供了一种新的定量分析方法。 | ||
搜索关键词: | 一种 红外 光谱 模型 建模 方法 | ||
【主权项】:
一种用于近红外光谱的多模型建模方法,其特征在于:它是从波长方法选取一定数目的波长点建立子模型,之后用boosting学习方法建立多个子模型,最后用所有子模型预测结果的加权平均得到未知样本浓度的最终预测结果,其中波长点权重的更新是基于偏最小二乘建立子模型的得分与载荷乘积得到的预测光谱与建模子集光谱的差值;所述的方法包括以下步骤:1)采集被测物样本的近红外光谱数据,随机分成两部分,包括训练集和预测集样本,用常规方法测定训练集中样本的被测成分浓度含量,得到训练集样本的被测成分浓度向量,其中训练集样本用来建立模型并优化参数,预测集样本用来检验模型的预测能力;2)对训练集样本进行波长点boosting重采样,建立多个基于波长空间子模型;①将训练集光谱矩阵Xm×n中所有波长点赋予相等的取样权重wi,1,wi,1=1/n(i=1,...,n)其中m和n分别为训练集中样本数目和波长点的数目;②根据波长点的取样权重wi从原始训练集样本中通过概率取样的方式挑选出一定数目的波长点作为一个训练子集;③用训练子集的样本建立一个偏最小二乘回归(PLS)子模型,得到PLS子模型的得分和载荷,利用得分和载荷的乘积得到训练集的预测光谱矩阵Dm×n;④计算训练子集中光谱与预测光谱的误差的绝对值Em×n=|Xm×n‑Dm×n|,并取每个波长点下的平均值ei=mean(Em×n),(i=1,...,n);⑤根据ei,采用计算损失函数LiLi=1‑exp[‑ei/max(ei)](i=1,...,n);⑥计算平均损失L‾=Σi=1nLiwi;]]>⑦计算模型的自信率ββ=L‾/(1-L‾);]]>⑧根据平均损失及模型的自信率β更新样本的取样权重wi,new=wi,oldβ‑L;归一化新的取样权重,保证所有波长点的取样权重加和等于1;重复步骤②‑⑧达到T次,建立T个子模型;3)对于未知样品,通过T个子模型的预测结果加权平均,得到最终预测结果所述一定数目的波长点的选取方法是:固定模型总数,按总波长点数的5%~100%,每间隔5%,改变被选取的波长点的数目,计算RMSECV值,RMSECV最小值对应的波长点数为每次循环选取的波长点数;子模型个数的确定方式是:给定一个足够大的模型数目值,计算训练集采用多模型RMSECV随着模型个数的变化,RMSECV值趋于稳定时为应建立的模型个数。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津工业大学,未经天津工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201310537968.3/,转载请声明来源钻瓜专利网。