[发明专利]一种基于最小相关系数的多变量校正特征波长选择方法有效
申请号: | 201910797203.0 | 申请日: | 2019-08-27 |
公开(公告)号: | CN110503156B | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 陈争光 | 申请(专利权)人: | 黑龙江八一农垦大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01N21/359 |
代理公司: | 北京艾皮专利代理有限公司 11777 | 代理人: | 刘媛 |
地址: | 163000 黑*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 最小 相关系数 多变 校正 特征 波长 选择 方法 | ||
本发明公开了一种基于最小相关系数的多变量校正特征波长选择方法,要解决的是现有波长选择方法的问题。本发明的步骤如下:对光谱数据集
技术领域
本发明涉及近红外光谱波长选择领域,具体是一种基于最小相关系数的多变量校正特征波长选择方法。
背景技术
近年来,近红外光谱技术在石油化工、制药、环境、临床、农业、食品和生物医学等领域的应用越来越广泛。近红外光谱区(800-2500nm)主要是由含氢基团的倍频和合频吸收峰组成,吸收强度较弱灵敏度较低,吸收带较宽且严重重叠,对全谱建模进行定量分析时会存在多重共线性或无信息变量过多等不足。对全谱进行特征波长选择就是减小数据冗余和多重共线性,可以提高模型的预测精度,简化模型的复杂度。
国内外常见的变量选择方法包括:无信息变量消除法、竞争性自适应重加权采样法、间隔偏最小二乘法、反向区间偏最小二乘法、连续投影算法、遗传算法等等。其中连续投影算法(successive projections algorithm,SPA)是一种通过向量的投影分析以达到变量间共线性最小化的波长选择算法,但其原理不易于理解,运行较为复杂,其余的算法也存在变量之间的共线性的问题,人们也在进行相关方面的研究。
发明内容
本发明实施例的目的在于提供一种基于最小相关系数的多变量校正特征波长选择方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明实施例提供如下技术方案:
一种基于最小相关系数的多变量校正特征波长选择方法,具体步骤如下:
步骤一,根据多个样本的近红外光谱数据和化学浓度数据得到光谱数据矩阵XN×K和浓度向量YN×1,其中,N为样本数,K为光谱数据点数,对光谱数据矩阵XN×K进行Savitzky-Golay(S-G)一阶导处理,可以校正光谱基线,消除背景的干扰,提高光谱分辨率,并且在一定程度上减少了各变量间的线性相关性,为后续波长选择奠定基础;
步骤二,计算光谱数据矩阵XN×K中各列向量之间的相关系数的绝对值,得到矩阵RK×K;相关系数是研究变量之间线性相关程度的量,相关系数越小说明两个向量之间相关性越低,用于建模时,其共线性就越低;
步骤三,计算矩阵RK×K中各列向量除对角线上的元素(r(i,i)=1)之外的其他元素的平均值和标准差σj,j=1,2,…,K;
步骤四,选取(σmin,σmax)=(min(σj),max(σj)),j=1,2,…,K;RK×K某列相关系数平均值越小,说明该波长点与其他各波长点之间的相关性整体较小,某列相关系数标准差越小说明该列相关系数数据的波动较小,数据分布较集中,同时满足相关系数平均值和标准差较小的波长点是潜在的待选波长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于黑龙江八一农垦大学,未经黑龙江八一农垦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910797203.0/2.html,转载请声明来源钻瓜专利网。