[发明专利]一种近红外光谱的多模型建模方法有效

申请号：	201310537968.3	申请日：	2013-10-31
公开（公告）号：	CN103528990B	公开（公告）日：	2017-07-28
发明（设计）人：	卞希慧;张彩霞;刘巍;谭小耀;郭玉高;王秋男	申请（专利权）人：	天津工业大学
主分类号：	G01N21/359	分类号：	G01N21/359
代理公司：	暂无信息	代理人：	暂无信息
地址：	300160 ***	国省代码：	天津;12
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种红外光谱模型建模方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种用于近红外光谱的多模型建模方法，其特征在于：它是从波长方法选取一定数目的波长点建立子模型，之后用boosting学习方法建立多个子模型，最后用所有子模型预测结果的加权平均得到未知样本浓度的最终预测结果，其中波长点权重的更新是基于偏最小二乘建立子模型的得分与载荷乘积得到的预测光谱与建模子集光谱的差值；

所述的方法包括以下步骤：

1)采集被测物样本的近红外光谱数据，随机分成两部分，包括训练集和预测集样本，用常规方法测定训练集中样本的被测成分浓度含量，得到训练集样本的被测成分浓度向量，其中训练集样本用来建立模型并优化参数，预测集样本用来检验模型的预测能力；

2)对训练集样本进行波长点boosting重采样，建立多个基于波长空间子模型；

①将训练集光谱矩阵X_m×n中所有波长点赋予相等的取样权重w_i，1，

w_i，1＝1/n(i＝1，...，n)

其中m和n分别为训练集中样本数目和波长点的数目；

②根据波长点的取样权重w_i从原始训练集样本中通过概率取样的方式挑选出一定数目的波长点作为一个训练子集；

③用训练子集的样本建立一个偏最小二乘回归(PLS)子模型，得到PLS子模型的得分和载荷，利用得分和载荷的乘积得到训练集的预测光谱矩阵D_m×n；

④计算训练子集中光谱与预测光谱的误差的绝对值E_m×n＝|X_m×n-D_m×n|，并取每个波长点下的平均值e_i＝mean(E_m×n)，(i＝1，...，n)；

⑤根据e_i，采用计算损失函数L_i

L_i＝1-exp[-e_i/max(e_i)](i＝1，...，n)；

⑥计算平均损失

$<mrow><mover><mi>L</mi><mo>&OverBar;</mo></mover><mo>=</mo><munderover><mo>Σ</mo><mrow><mi>i</mi><mo>=</mo><mn>1</mn></mrow><mi>n</mi></munderover><msub><mi>L</mi><mi>i</mi></msub><msub><mi>w</mi><mi>i</mi></msub><mo>;</mo></mrow>$

⑦计算模型的自信率β

$<mrow><mi>β</mi><mo>=</mo><mover><mi>L</mi><mo>&OverBar;</mo></mover><mo>/</mo><mrow><mo>(</mo><mn>1</mn><mo>-</mo><mover><mi>L</mi><mo>&OverBar;</mo></mover><mo>)</mo></mrow><mo>;</mo></mrow>$

⑧根据平均损失及模型的自信率β更新样本的取样权重

w_i，new＝w_i，oldβ^-L；

归一化新的取样权重，保证所有波长点的取样权重加和等于1；

重复步骤②-⑧达到T次，建立T个子模型；

3)对于未知样品，通过T个子模型的预测结果加权平均，得到最终预测结果

所述一定数目的波长点的选取方法是：固定模型总数，按总波长点数的5％～100％，每间隔5％，改变被选取的波长点的数目，计算RMSECV值，RMSECV最小值对应的波长点数为每次循环选取的波长点数；

子模型个数的确定方式是：给定一个足够大的模型数目值，计算训练集采用多模型RMSECV随着模型个数的变化，RMSECV值趋于稳定时为应建立的模型个数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于天津工业大学，未经天津工业大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201310537968.3/1.html，转载请声明来源钻瓜专利网。