[发明专利]一种色谱质谱自动积分方法、系统、设备、介质在审
申请号: | 202210387940.5 | 申请日: | 2022-04-14 |
公开(公告)号: | CN114755357A | 公开(公告)日: | 2022-07-15 |
发明(设计)人: | 张杨刚;王英杰;余阔海;唐堂 | 申请(专利权)人: | 武汉迈特维尔生物科技有限公司 |
主分类号: | G01N30/86 | 分类号: | G01N30/86;G01N30/02;G01N30/72 |
代理公司: | 北京中知星原知识产权代理事务所(普通合伙) 11868 | 代理人: | 马如 |
地址: | 430074 湖北省武汉市东湖新技术开发*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 色谱 自动 积分 方法 系统 设备 介质 | ||
本发明涉及一种色谱质谱自动积分方法、系统、设备、介质,属于蛋白质组学及代谢组学分析技术领域。先对色谱质谱原始谱图进行转换,得到标准化谱图图片,再利用峰识别算法对标准化谱图图片进行初步峰识别,得到候选峰结果,同时利用训练好的深度学习模型对标准化谱图图片进行预测,得到谱图分类结果,最后基于谱图分类结果对候选峰结果进行筛选,去除候选峰结果中预测结果为噪音的峰结果,得到自动积分结果,通过对获取的色谱质谱图像进行深度学习模型预测,可以替代人工对色谱质谱的峰形进行判别,该方法准确率高,特异性高,有效的降低了常规自动积分方法的假阳性,完全能够高效的实现对人工积分的自动化替换。
技术领域
本发明涉及蛋白质组学及代谢组学分析技术领域,特别是涉及一种基于深度学习模型的色谱质谱自动积分方法、系统、设备、介质。
背景技术
蛋白质组学和代谢组学是系统生物学领域内继基因组学后新发展出来的两门学科。蛋白质组学是从蛋白整体水平上对细胞内蛋白质的组成、活动规律及蛋白质与蛋白质的相互作用进行研究,而代谢组学通过检测生物体在受到外源刺激或基因修饰后其体内代谢物质的变化,从而探索整个生物体的代谢机制。
色谱-串联质谱技术作为一种联用技术,结合了色谱的高效分离能力和质谱采集的待检测分子的精确分子量及强度信息,该技术具有灵敏度高、选择性强、通量高的优势,可以获得丰富的蛋白质和代谢物的定性和定量信息,因而在蛋白质组学和代谢组学分析领域具有显著的优势。
但由于色谱质谱峰结果的多样性,仪器软件自带的积分结果往往存在假阳性高,峰形判断不准的缺点,需要人工进行核查,不仅耗时费力,还存在不同人对峰结果判断存在差异的情况,对于代谢组学和蛋白质组学的结果一致性造成不利的影响。
基于此,亟需一种能够自动进行峰形判别的色谱质谱自动积分方法、系统、设备、介质。
发明内容
本发明的目的是提供一种色谱质谱自动积分方法、系统、设备、介质,利用深度学习模型自动对色谱质谱的峰形进行判别,能够高准确度、高效率的得到色谱质谱峰的定量结果。
为实现上述目的,本发明提供了如下方案:
一种色谱质谱自动积分方法,所述自动积分方法包括:
对色谱质谱原始谱图进行转换,得到标准化谱图图片;
利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
一种色谱质谱自动积分系统,所述自动积分系统包括:
转换模块,用于对色谱质谱原始谱图进行转换,得到标准化谱图图片;
初步识别模块,用于利用峰识别算法对所述标准化谱图图片进行初步峰识别,得到候选峰结果;
预测模块,用于利用训练好的深度学习模型对所述标准化谱图图片进行预测,得到谱图分类结果;所述谱图分类结果包括所述标准化谱图图片中每一峰形的类型;所述类型包括噪音和正常;
筛选模块,用于基于所述谱图分类结果对所述候选峰结果进行筛选,去除所述候选峰结果中预测结果为噪音的峰结果,得到自动积分结果。
一种色谱质谱自动积分设备,包括:
处理器;以及
存储器,其中存储计算机可读程序指令,
其中,在所述计算机可读程序指令被所述处理器运行时执行上述的自动积分方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉迈特维尔生物科技有限公司,未经武汉迈特维尔生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210387940.5/2.html,转载请声明来源钻瓜专利网。