[发明专利]一种用于深度学习训练的拉曼光谱数据集分析方法在审
申请号: | 202011409057.9 | 申请日: | 2020-12-03 |
公开(公告)号: | CN112730373A | 公开(公告)日: | 2021-04-30 |
发明(设计)人: | 祝连庆;夏嘉斌;于明鑫;董明利;孙广开;何彦霖;庄炜 | 申请(专利权)人: | 北京信息科技大学 |
主分类号: | G01N21/65 | 分类号: | G01N21/65;G06N3/08 |
代理公司: | 北京律恒立业知识产权代理事务所(特殊普通合伙) 11416 | 代理人: | 王琦;庞立岩 |
地址: | 100085 北京市海淀区清*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 深度 学习 训练 光谱 数据 分析 方法 | ||
1.一种用于深度学习训练的拉曼光谱数据集分析方法,其特征在于,所述分析方法包括以下步骤:
(1)拉曼光谱数据预处理;
(2)拉曼光谱数据相关度检测;
(3)拉曼光谱数据标记。
2.根据权利要求1所述的一种用于深度学习训练的拉曼光谱数据集分析方法,其特征在于,所述预处理包括:拉曼光谱范围截取,拉曼光谱平滑处理,拉曼光谱去基线处理,拉曼光谱数据归一化处理;
所述拉曼光谱范围截取有两个截取范围,所述两个截取范围分别为600~1800cm-1和2800~3200cm-1。
3.根据权利要求2所述的一种用于深度学习训练的拉曼光谱数据集分析方法,其特征在于,所述拉曼光谱平滑处理使用Savitzky-Golay滤波法,Savitzky-Golay滤波法是对一定窗口长度内的数据点进行k阶多项式拟合,从而得到拟合后的结果,在窗口内的数据的拟合通过最小二乘拟合实现;
所述窗口长度为n=2m+1;
所述数据点为x=(-m,-m+1,…0,1,…m-1,m);
所述Savitzky-Golay滤波法的具体过程如下:
y=a0+a1x+a2x2+...+ak-1xk-1
由n个上述方程,构成了k元线性方程组。要使方程组有解,则n应大于等于k,一般选择n>k,通过最小二乘法拟合确定拟合参数A。由此得到
用矩阵表示为
Y(2m+1)×1=X(2m+1)×kAK×1+E(2m+1)×1
A的最小二乘解A为
Y的模型预测值或滤波值为
所以矩阵算子为B=X(XTX)-1XT。
4.根据权利要求2所述的一种用于深度学习训练的拉曼光谱数据集分析方法,其特征在于,所述拉曼光谱去基线处理使用非对称重加权惩罚最小二乘法算法,具体过程如下:
正则化最小二乘函数的最小化来得到平滑信号z,具体公式如下:
S(z)=(y-z)T(y-z)+λzTDTDz
其中,y为长度为N的信号,z是要找到的平滑信号,y和z是列向量,λ是平衡参数,D是差分矩阵;所述平滑信号z遵循y的趋势,同时保持其平滑度;
假设二阶差分矩阵D为:
引入权重向量w后惩罚最小二乘函数为以下公式:
S(z)=(y-z)TW(y-z)+λzTDTDz
其中,W是对角线上为w对角矩阵,y为长度为N的信号,z是要找到的平滑信号,y和z是列向量,λ是平衡参数,D是差分矩阵;
设偏导向量为零S/zT=0,得出惩罚最小二乘函数的最小化解为:
z=(W+λDTD)-1Wy
当信号区域中没有峰值或信号区域远大于基线时,增加非对称权重wi,具体计算公式如下:
其中,和是d-的平均值和标准偏差,给定d=y-z,d-是d的一部分,其仅在yi<zi的区域中定义;
其中,
5.根据权利要求1所述的一种用于深度学习训练的拉曼光谱数据集分析方法,其特征在于,所述拉曼光谱数据相关度检测是将预处理后的拉曼光谱数据与标准光谱进行相关性检测,采用相关系数表明光谱之间的线性相关程度,相关系数具体公式如下:
其中,Cov(X,Y)为X与Y的协方差,Var[X]为X的方差,Var[Y]为Y的方差,将相关系数大于80%的数据存留。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京信息科技大学,未经北京信息科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011409057.9/1.html,转载请声明来源钻瓜专利网。