[发明专利]基于窗口竞争性自适应重加权采样策略的近红外特征光谱变量选择方法有效
申请号: | 201811009661.5 | 申请日: | 2018-08-31 |
公开(公告)号: | CN109060716B | 公开(公告)日: | 2021-03-02 |
发明(设计)人: | 李跑;杜国荣;郑郁;李尚科;杨清华 | 申请(专利权)人: | 湖南农业大学 |
主分类号: | G01N21/359 | 分类号: | G01N21/359;G06F17/18 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 何为;李宇 |
地址: | 410128 *** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 窗口 竞争性 自适应 加权 采样 策略 红外 特征 光谱 变量 选择 方法 | ||
一种基于窗口竞争性自适应重加权采样策略的近红外特征光谱变量选择方法,其将m个样品在n个近红外波长下采集的近红外光谱数据X建立m×n的矩阵,矩阵的每一列代表了m个样品在一波长下的光谱变量;沿着波长方向将n个光谱变量均等分为N个窗口。随机选取m×80%样品的光谱变量和对应的样品目标组分数据y建立PLS模型,得到回归系数,统计每个窗口内的回归系数,使用其绝对值的均值作为是否保留该窗口的依据指标。依次删除回归系数绝对值均值最小窗口的光谱变量,直到保留窗口数为停止。使用剩余光谱变量和样品目标组分数据y建立PLS模型并计算交互验证均方根误差RMSECV。将RMSECV最小值对应的光谱变量作为近红外特征光谱变量建立最终模型和分析。
技术领域
本发明涉及分析化学领域的无损分析,特别涉及一种用于近红外特征光谱变量选择的窗口竞争性自适应重加权采样策略方法(window competitive adaptive reweightedsampling, WCARS)。
背景技术
随着近红外仪器和化学计量学方法的飞速发展,近红外光谱技术得到了广泛应用。近红外光谱反映的是物质吸收的倍频与合频信息,包含了绝大多数类型有机物组成和分子结构的丰富信息。与传统方法相比,近红外光谱具有穿透力强,无需复杂前处理操作,不破坏样品,可通过光纤进行远距离在线检测等优点,因此被广泛用于食品、医药、烟草和环境等多个领域复杂样品的快速分析。由于近红外光谱谱峰较宽,实际样品中各种成分的吸收峰重叠严重,近红外光谱定性和定量分析必须通过建立多元校正模型来实现。
样品光谱中通常包含具有大量冗余信息的冗余光谱变量,且光谱变量之间存在较为严重的共线性关系,如果直接采用全谱建立模型,不仅会增大计算量,且冗余光谱变量会降低模型的准确性。因此需要通过消除光谱中的冗余光谱变量,挑选出代表样品性质特征的光谱变量代替全谱去建立定量模型,以提高近红外光谱分析的准确性。基于进化论中适者生存原理的竞争性自适应重加权采样(competitive adaptive reweighted sampling,CARS)算法因具有计算速度快、筛选得到的特征光谱变量少等优点,在近红外特征光谱变量筛选领域得到了广泛的应用。然而该方法在计算过程中容易出现校正集和预测集结果不一致情况。这是因为CARS算法过于依赖校正集交叉验证结果,并未考虑相邻变量之间的协同作用。
发明内容
本发明针对CARS算法难以实现相邻光谱变量的选择,提供一种基于窗口竞争性自适应重加权采样策略的近红外特征光谱变量选择方法(window competitive adaptivereweighted sampling,WCARS),其考虑相邻光谱变量之间的协同作用,通过结合“窗口”以及CARS算法的优势,选择样品近红外光谱数据中的特征光谱变量,用于和目标组分数据建立PLS模型,然后使用该模型用于未知样品分析。
为达上述目的,本发明基于窗口竞争性自适应重加权采样策略的近红外特征光谱变量选择方法(window competitive adaptive reweighted sampling,WCARS)包括以下步骤:
步骤l:利用m个样品在n个近红外波长下采集的近红外光谱数据X建立m×n的矩阵,其中,矩阵的每一列代表了m个样品在一波长下的光谱变量,即近红外光谱数据X具有n个光谱变量,沿着波长方向将近红外光谱数据X的n个光谱变量均等分为N个窗口,样品目标组分数据用y表示,迭代次数设置为T,初始化i=0,i≤T,T取100和N两者之间的最小值,计算剔除窗口速率r=N/T,窗口宽度为n/N;
步骤2:i=i+1;
步骤3:随机选取经步骤l划分窗口后的m×80%个样品的近红外光谱数据,使用选取样品的保留窗口中的光谱变量和对应的样品目标组分数据y建立PLS模型,得到多个回归系数,回归系数的个数和保留窗口中的光谱变量数目相同,按照保留窗口中光谱变量的窗口位置将多个回归系数也分成相同窗口;
步骤4:统计步骤3划分得到的窗口内回归系数绝对值的均值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南农业大学,未经湖南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811009661.5/2.html,转载请声明来源钻瓜专利网。