[发明专利]一种基于迁移学习的跨仪器拉曼光谱定性分析方法有效

专利信息
申请号: 202010298095.5 申请日: 2020-04-16
公开(公告)号: CN111523582B 公开(公告)日: 2023-05-12
发明(设计)人: 谢怡;陈嘉祥;韩李翔;刘国坤;戴平阳;罗思恒 申请(专利权)人: 厦门大学;厦门大学深圳研究院
主分类号: G06F18/241 分类号: G06F18/241;G06N20/00;G01N21/65
代理公司: 厦门市首创君合专利事务所有限公司 35204 代理人: 张松亭;杨锴
地址: 361000 *** 国省代码: 福建;35
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 迁移 学习 仪器 光谱 定性分析 方法
【说明书】:

本发明涉及一种基于迁移学习的跨仪器拉曼光谱定性分析方法,将迁移学习中数据分布自适应的思路应用于拉曼光谱跨仪器物质识别,解决拉曼光谱跨仪器识别的问题。本发明运用迁移学习领域中数据分布自适应的思路,通过寻找最优映射,最大程度地缩小源域和目标域之间的数据分布差异;然后运用一种机器学习算法对映射后的拉曼光谱进行分类识别,即使用源域的已标注光谱来训练模型,对目标域的待测光谱进行分类。本发明自动完成“谱图预处理‑谱图同构化‑寻找和实现最优映射‑训练分类器和物质识别”的分析过程,减少对人工数据标注的依赖,满足跨仪器拉曼光谱数据定性分析的要求,大大提高物质识别准确率。

技术领域

本发明涉及拉曼光谱技术领域,更具体地说,涉及一种基于迁移学习的跨仪器拉曼光谱定性分析方法。

背景技术

随着社会经济和科学技术的发展,人们对物质快速检测的需求与日俱增,特别在食品安全、环境保护和医疗卫生等领域有着广泛的应用需求。拉曼光谱以拉曼散射效应为基础,具有分子指纹信息,由于快速、无损和无需制备的优点,十分适用于现场检测,即通过定性分析识别目标物质。

传统的拉曼光谱定性分析采用与标准谱图进行模板匹配的方法,通过相似度阈值逐一判定待测光谱样本是否含有目标物质。此类方法在实际检测的复杂环境中易受到激光产生的荧光背景、射线产生的毛刺峰、仪器的固有噪声和相邻拉曼峰相互“淹没”等因素的影响,在复杂体系中难以获得满意的识别结果。

随着机器学习方法的发展,基于机器学习的拉曼光谱分析方法逐渐被开发和应用于实际检测。例如,使用基于多重迭代优化的最小二乘支持向量机模型对橄榄油进行拉曼光谱检测,能够快速地鉴别是否掺入了葵花籽油、大豆油或玉米油;使用自适应超图算法自动识别复杂食品体系中的常见色素物质;采用基于卷积神经网络的模型,直接对高维数据进行分类,在矿物样品数据集上取得良好效果。

但是,伴随机器学习技术在拉曼光谱分析领域的推广,有监督学习的方法的劣势日益凸显。传统的机器学习方法要求训练和测试数据服从相同分布,并且需要足够的已标注数据来训练模型,往往还固定输入数据的维度。因此,制造商或使用者需要针对每款光谱仪器建立专用的数据库,花费大量时间和物力,投入专业人员对采集的拉曼光谱数据进行标注,建设和维护的成本都很高,限制其在快速检测领域的应用。

另一方面,不同拉曼仪器的分辨率、激光器和电耦合元件(CCD)存在差异,进而不同仪器的数据分布和维度不一致,数据库无法通用。即使是同一款仪器,由于仪器公差的存在其数据的分布也会有一定的差异。针对每款拉曼仪器,需要建立专用的拉曼光谱数据库用于训练,这将进一步增大数据标注的难度。

因此,大数据与少标注的矛盾、普适分析模型与仪器个性化的矛盾成为亟待解决的问题。

同时,便携式拉曼仪器和快检应用的普及,迎来了光谱大数据,每次仪器检测都会产生新的拉曼光谱数据,而这些数据往往需要标注才能用于传统机器学习模型的训练。而且,一款拉曼仪器若具有标注完备的光谱数据库,以其数据训练出来的分类模型,难以准确分类识别另一款仪器采集的待测光谱,因为传统机器学习关于训练集和测试集的数据分布一致性假设无法满足。针对跨仪器拉曼光谱识别,现有方案一般是通过工程化手段,例如直接使用一些插值和校正算法来解决或者说部分解决。在某些特定条件下,能获得尚可接受的识别效果。但这些方法缺乏通用性和理论依据,即没有从本质上分析和解决跨仪器的拉曼光谱分析问题,只适用于有限的特殊情况。

因此,光谱大数据处理也面临着光谱数据标注匮乏和仪器间数据库共享的新问题。

中国发明专利申请201910616759.5公开了一种基于迁移学习的拉曼光谱智能分析方法,对大规模的标准拉曼光谱数据库进行数据增强和插值处理,并使用处理后的标准数据训练深度学习模型;待测拉曼光谱做相同的数据增强和插值处理后,使用训练好的模型进行分类。

上述发明专利申请利用标准数据库和插值算法缓解了数据标注匮乏的问题,但无法解决跨仪器的问题;而且针对标准谱的操作,难以适应快检应用中的复杂基质环境。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学;厦门大学深圳研究院,未经厦门大学;厦门大学深圳研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202010298095.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top