[发明专利]一种基于迁移学习的跨仪器拉曼光谱定性分析方法有效
申请号: | 202010298095.5 | 申请日: | 2020-04-16 |
公开(公告)号: | CN111523582B | 公开(公告)日: | 2023-05-12 |
发明(设计)人: | 谢怡;陈嘉祥;韩李翔;刘国坤;戴平阳;罗思恒 | 申请(专利权)人: | 厦门大学;厦门大学深圳研究院 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06N20/00;G01N21/65 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;杨锴 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 迁移 学习 仪器 光谱 定性分析 方法 | ||
1.一种基于迁移学习的跨仪器拉曼光谱定性分析方法,其特征在于,步骤如下:
1)对作为源域的源拉曼光谱仪器的光谱数据d'S与作为目标域的目标拉曼光谱仪器的光谱数据d'T进行同构化处理,形成统一维度的源域特征向量vS和目标域特征向量vT;步骤1)具体为:
1.1)确定源拉曼光谱仪器与目标拉曼光谱仪器的共享有效光谱范围[p,q],其中,p≥max{d'S(1,1),d'T(1,1)},q≤min{d'S(1,xS),d'T(1,xT)};在共享有效光谱范围[p,q]内,源拉曼光谱仪器的有效数据dS的维度为2×lS,fS为源拉曼光谱仪器的激光器频率;目标拉曼光谱仪器的有效数据dT的维度为2×lT,fT为目标拉曼光谱仪器的激光器频率;
1.2)选择如下之一的同构化方向,获得长度统一为l的源域特征向量vS和目标域特征向量vT,具体如下:
面向源域进行同构,先使l=lS,vS=dS(2,:),然后将dT(2,:)按照dS(1,:)的波数位置进行插值,得到目标域特征向量vT;
或者,面向目标域进行同构,先使l=lT,vT=dT(2,:),然后将dS(2,:)按照dT(1,:)的波数位置进行插值,得到源域特征向量vS;
2)将源拉曼光谱仪器的源域特征向量vS与目标拉曼光谱仪器的目标域特征向量vT映射到同一个特征空间,并使得源域和目标域的数据分布距离最小;步骤2)包括寻找最优映射、实施最优映射,最小化源域和目标域之间的数据分布差异,步骤2)中,寻找最优映射,具体如下:
2.1.1)获取N个l维的特征向量,N=NS+NT,NS为来自源域的光谱样本的数量,NT为来自目标域的光谱样本的数量,得到维度为NS×l的源域特征向量矩阵XS和维度为NT×l的目标域特征向量矩阵XT,其中,XS的每一行表示一个源域光谱的源域特征向量vS,XT的每一行表示一个目标域光谱的目标域特征向量vT;
2.1.2)定义长度为NS的源域标签列向量yS,当源域的第i个光谱样本含有第j种目标物质时,yS(i)=j,i=1,2,…,NS,j=1,2,…,R,R是目标物质的类别总数;
2.1.3)在保持原数据集特征的情况下,最小化源域和目标域的数据分布差异,以为最优化目标,寻找最优映射
3)运用机器学习算法对映射后的拉曼光谱进行分类识别,实现在源拉曼光谱仪器的光谱数据库已标注目标物质的情况下,对目标拉曼光谱仪器采集的待测光谱进行物质分类识别。
2.根据权利要求1所述的基于迁移学习的跨仪器拉曼光谱定性分析方法,其特征在于,步骤1)中,源拉曼光谱仪器的光谱数据d'S的维度为2×xS,第一行向量d'S(1,:)记录d'S的波数,第二行向量d'S(2,:)记录波数对应的光谱信号强度,目标拉曼光谱仪器的光谱数据d'T的维度为2×xT,第一行向量d'T(1,:)记录d'T的波数,第二行向量d'T(2,:)记录波数对应的光谱信号强度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学;厦门大学深圳研究院,未经厦门大学;厦门大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010298095.5/1.html,转载请声明来源钻瓜专利网。