[发明专利]一种光谱分析中样品集划分的化学计量学方法有效
申请号: | 201210375066.X | 申请日: | 2012-10-06 |
公开(公告)号: | CN102854151A | 公开(公告)日: | 2013-01-02 |
发明(设计)人: | 陈华舟 | 申请(专利权)人: | 桂林理工大学 |
主分类号: | G01N21/25 | 分类号: | G01N21/25;G01N21/35;G01N21/33;G01N21/65 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 541004 广*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种光谱分析中样品集划分的化学计量学方法。计算参考化学值和每一个波长上的光谱吸光度的相关系数,在全谱范围内找到相关最高的波长点;分别对样品的参考化学值和光谱数据进行归一化处理;基于归一化处理的数据,设计把参考化学值最大和最小的2个样品,以及吸光度值最大和最小的2个样品放入定标集,并把相应次大次小值的4个样品放入预测集;对剩余的样品做充分多次的随机划分,基于最高相关波长点,对每一次划分分别计算定标集和预测集样品的化学值和吸光度的相关系数,如果某一个划分的定标集相关系数和预测集相关系数充分接近,则选择这个划分用来建立光谱分析模型。本发明为光谱分析的模型优化提供了良好的数据基础。 | ||
搜索关键词: | 一种 光谱分析 样品 划分 化学 计量学 方法 | ||
【主权项】:
1.一种光谱分析中样品集划分的化学计量学方法,其特征在于具体步骤为:1)数据归一化a)参考化学值的归一化C m = 1 N Σ j = 1 N C j , - - - ( 1 ) ]]>norm ( C j ) = C j Σ j = 1 N ( C j - C ‾ ) 2 = Δ C n ( j ) , ]]> j=1,2....N, (2)b)光谱数据的归一化
i=1,2....P, (3)
i=1,2....P,j=1,2….N,(4)| A j | = Σ i = 1 P ( norm ( A ij ) ) 2 = Δ A n ( j ) , ]]> j=1,2....N, (5)其中,N为样品个数,P为波长点个数;Cj为样品j的参考化学值,Cm为所有样品的参考化学值均值,Cn(j)=norm(Cj)为该样品的参考化学值经过归一化计算之后的化学值数据;Aij为样品j在第i个波长的吸光度值,Ai,m为该样品在第i个波长处的吸光度平均值,norm(Aij)为该样品在第i个波长处的吸光度值经过归一化计算之后的吸光度值;An(j)=|Aj|为样品j的吸光度向量的模;基于上述参考化学值和吸光度的归一化计算,每个样品对应有一个Cn(j)和一个An(j);根据琅勃比尔定律,基于所有样品的Cn(j)和An(j)(j=1,2,...,N),回归计算每个样品的化学值预测值C’n(j),随后计算每个样品的归一化数据回归偏差,即RDND,进一步对所有样品计算RDND的平均值,即RDNDAve;RDND(j)=|C’n(j)-Cn(j)|, (6)2)最值和次值样品的划分为了定标预测模型能够具有保证良好的相关性,原则上需要把具有Cn(j)最大值和最小值的2个样品和具有An(j)最大值和最小值的2个样品放入定标集,把具有Cn(j)次大值和次小值的2个样品和具有An(j)次大值和次小值的2个样品放入预测集;然而,这其中所选择的样品可能有若干个是相同的,需要做相应的选择处理;具体操作过程如下:把具有Cn(j)最大值和最小值的2个样品和具有An(j)最大值和最小值的2个样品作为最值集合,记为SZ;同时把具有Cn(j)次大值和次小值的2样品和具有An(j)次大值和次小值的2样品作为次值集合,记为SC;首先假设SZ和SC的内部样品均不相同,设定每个集合内部的样品个数为4,下面针对SZ和SC的交集进行讨论,以确定最值样品的划分;如果SZ∩SC为空集,即SZ和SC互相之间没有相同的样品,则SZ所有样品放入定标集,SC所有样品放入预测集;进一步记录SZ内部具有相同样品的个数s1和SC内部具有相同样品的个数s2,即s1,s2∈{0,1,2};如果SZ∩SC不为空集,则记录SZ∩SC内部样品的个数s3,s3=1,2,3,4,把SZ∩SC内部每一个样品的RDND分别与RDNDAve比较大小,如果某个样品的RDND>RDNDAve,则该样品选择放入定标集,否则将该样品选择放入预测集;然后,把SZ∩Cs(SC)内部所有样品放入定标集,把Cs(SZ)∩SC内部所有样品放入预测集,并分别记录SZ∩Cs(SC)内部和Cs(SZ)∩SC内部具有相同样品的个数s1和s2,即s1,s2∈{0,1,2};其中Cs是补集运算符;3)剩余样品的划分原则经过最值样品的划分以后,剩余样品个数为N-8+s1+s2+s3。关于剩余样品的划分,基于最高相关的原则,分别计算每一个波长点i的光谱数据和参考化学值的相关系数R(i),R ( i ) = Σ j = 1 N ( C j - C m ) ( A ij - A i , m ) Σ j = 1 N ( C j - C m ) 2 Σ j = 1 N ( A ij - A i , m ) 2 , ]]> i=1,2….P,(7)从所有的波长点中找到最大的Rnote=max{R(i),i=1,2....P},并记录Rnote所在的波长点序号inote;对剩余的样品做足够多次的随意划分,对每一次划分,选取第inote个波长点处的光谱数据{Anote},结合样品的参考化学值,分别在定标集内和预测集内计算相关系数RCset和RPset;R Cset = Σ j = 1 L ( C L ( j ) - C Lm ) ( A note , L ( j ) - A note , Lm ) Σ j = 1 L ( C L ( j ) - C Lm ) 2 Σ j = 1 L ( A note , L ( j ) - A note , Lm ) 2 , - - - ( 8 ) ]]>R Pset = Σ j = 1 K ( C K ( j ) - C Km ) ( A note , K ( j ) - A note , Km ) Σ j = 1 K ( C K ( j ) - C Km ) 2 Σ j = 1 K ( A note , K ( j ) - A note , Km ) 2 , - - - ( 9 ) ]]> 其中L、K分别为定标集和预测集样品数量,即L+K=N;CLm,CKm分别为定标集和预测集样品化学值平均值,Anote,L(j)为定标集中第j个样品在第inote个波长点上的光谱数据,Anote,Lm为定标集样品在第inote个波长点上的光谱数据均值,Anote,K(j)为预测集中第j个样品在第inote个波长点上的光谱数据,Anote,Km为预测集样品在第inote个波长点上的光谱数据均值;计算RCset和RPset之间的绝对偏差,即Absolute offset of correlation coefficients,简称AOC:AOC=|RCset-RPset|,(10)选择AOC足够小的一个划分作为以下建立近红外光谱分析模型的划分;按照这种划分方法,设计把全部待分析样品按照2:1的比例划分为定标集和预测集;根据设定的AOC选择合适的划分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林理工大学,未经桂林理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210375066.X/,转载请声明来源钻瓜专利网。
- 上一篇:有机水稻栽培方法
- 下一篇:一种三维多孔氧化镍分级结构材料的制备方法