[发明专利]一种蛋白质质谱定量分析结果的筛选方法及系统在审
申请号: | 202110424972.3 | 申请日: | 2021-04-20 |
公开(公告)号: | CN113284563A | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 何情祖;李一鸣;郭欢;韩家淮;帅建伟 | 申请(专利权)人: | 厦门大学 |
主分类号: | G16B40/10 | 分类号: | G16B40/10;G06N3/04 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;李艾华 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 定量分析 结果 筛选 方法 系统 | ||
本发明公开了一种蛋白质质谱定量分析结果的筛选方法及系统,包括:获取经过OpenSWATH筛选后的定量结果图像;利用归一化方法对定量结果图像中的6个子离子的XIC曲线进行标准归一化,将XIC的强度转换到0和1之间;通过训练好的卷积神经网络对归一化方法的输出进行分类,输出肽段为阳性肽段的概率;基于预设的双阈值进行筛选,如果所述概率小于等于第一预设阈值,则判断出对应的肽段为假阳性肽段,如果所述概率大于等于第二预设阈值,则判断出对应的肽段为阳性肽段,否则,判断出对应的肽段为模糊肽段。本发明对OpenSWATH输出结果中多肽的碎片离子色谱所有肽段进行分类,以去除假阳性肽段,减轻人工检测的任务量。
技术领域
本发明涉及蛋白质组学鉴定领域,具体涉及一种蛋白质质谱定量分析结果的筛选方法及系统。
背景技术
质谱技术广泛应用于多肽和蛋白质的鉴定和定量。数据独立采集(DIA:Dataindependent acquisition)是多肽和蛋白质鉴定和定量领域中的一种数据采集策略。SWATH是一种数据独立采集式的质谱采集模式,全称为全碎片离子顺序窗口化获取质谱(Sequential Windowed Acquisition of All Theoretical Fragment Ions,SWATH)。而OpenSWATH是一个分析SWATH-MS(MS:Mass Spectrometry)质谱数据的通用工具,首先从谱图库中提取理论色谱图,与质谱数据得到的实验谱图进行匹配,然后根据评分算法过滤肽段,去除掉错误的肽段匹配,从而得到定性和定量的分析结果。首先利用谱图库的信息,从质谱数据中提取出每个肽段对应的色谱峰,然后计算肽段子离子对应的色谱峰之间的相似性,过滤子离子相似性低的肽段,从而得到定性和定量的分析结果。然而,经OpenSWATH筛选后仍然存在假阳性肽段,导致定量结果不理想。因此,对所有肽段进行分类以过滤假阳性肽段是非常重要的。但是目前解决此分类问题的办法只有人工检测,人工检查的工作是将可视化的碎片子离子峰形图进行分类,分成阳性肽段和假阳性肽段两类,去除掉假阳性肽段,从而提高定性定量分析结果的准确性,但是即使是经过OpenSWATH筛选后的定量结果中数据量也非常庞大,再加上人力的分类是具有很强的主观性的,所以人工检测的任务量繁重且主观性过强。
分类问题是深度学习的基础问题之一,深度学习算法的很多问题都需要基于分类的特征提取再进行其他的操作。各类传统机器学习方法的分类效果,远不如深度学习。但目前的许多基于深度学习的分类方法,广泛应用于医学诊断、自然语言处理、地貌学等的处理中,在蛋白质鉴定领域还有许多分类问题需要解决。
发明内容
本发明的主要目的在于提出一种蛋白质质谱定量分析结果的筛选方法及系统,对OpenSWATH分析的鉴定结果进行分类,然后去除假阳性肽段,减轻人工检测的任务量。
本发明采用如下技术方案:
第一方面,一种蛋白质质谱定量分析结果的筛选方法,包括:
获取经过OpenSWATH筛选后的定量结果图像;
利用归一化方法对定量结果图像中的6个子离子的XIC曲线进行标准归一化,将XIC的强度转换到0和1之间;
通过训练好的卷积神经网络对归一化方法的输出进行分类,输出肽段为阳性肽段的概率;
基于预设的双阈值进行筛选;如果所述概率小于等于第一预设阈值,则判断出对应的肽段为假阳性肽段;如果所述概率大于等于第二预设阈值,则判断出对应的肽段为阳性肽段;否则,判断出对应的肽段为模糊肽段。
优选的,所述归一化方法包括最小最大归一化方法。
优选的,所述概率的范围为大于等于0且小于等于1。
优选的,所述卷积神经网络的训练方法,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110424972.3/2.html,转载请声明来源钻瓜专利网。