[发明专利]一种基于深度学习的蛋白质质谱数据的分析方法及系统在审
申请号: | 202110425032.6 | 申请日: | 2021-04-20 |
公开(公告)号: | CN113362899A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 何情祖;郭欢;帅建伟;韩家淮 | 申请(专利权)人: | 厦门大学 |
主分类号: | G16B40/10 | 分类号: | G16B40/10;G06N3/04;G06N3/067 |
代理公司: | 厦门市首创君合专利事务所有限公司 35204 | 代理人: | 张松亭;李艾华 |
地址: | 361000 *** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 蛋白质 数据 分析 方法 系统 | ||
本发明公开了一种基于深度学习的蛋白质质谱数据的分析方法及系统,包括:获取样品的DIA蛋白质数据;基于DIA蛋白质数据,沿驻留时间维度以特定步幅移动的滑块为最小处理单元,删除滑块中的低信噪比的背景离子,确定候选母离子和候选子离子;将候选子离子的提取色谱输入变分自编码器编码神经网络后,嵌入到欧氏空间中,然后用k均值分类算法将其划分为k类;基于蛋白质数据库将每个碎片子离子簇与相应的母离子结合,生成母离子‑碎片子离子对;通过计算与理论谱相匹配的碎片子离子间的相似度,再次判断这些母离子‑碎片子离子对,将相似度超过预设阈值的母离子‑碎片子离子对作为伪串联谱存储。本发明能够提高鉴定到的肽段和蛋白质的数量。
技术领域
本发明涉及蛋白质组学中蛋白质分析领域,具体涉及一种基于深度学习的蛋白质质谱数据的分析方法及系统。
背景技术
质谱技术长期以来一直是肽段和蛋白质鉴定和定量的主导技术。典型的识别策略是结合数据依赖获取(DDA)模式和搜索引擎来执行的。在串行模式下以DDA模式采集数据,当扫描一级质谱(MS1)时只选择最强的的k个肽段离子,将其打碎,打碎生成的多肽子离子,形成串联质谱(二级质谱MS2)。搜索引擎将MS2谱图与肽段的理论谱图进行匹配以识别MS2谱图对应的肽段。然而,因为强度排名前k的肽段离子在重复的DDA实验中是随机变化的,所以DDA方法鉴定到的多肽的可重复性较差。为了克服DDA模式的局限性,数据独立采集(DIA)策略出现了。SWATH是一种通用的DIA模式,全称为全碎片离子顺序窗口化获取质谱数据不依赖采集模式(Sequential Windowed Acquisition of All Theoretical FragmentIons),质谱仪将每个MS1独立窗口内的肽段离子进行打碎,并采集所有碎片离子的信号。显然,大量多肽的碎片信号在相应的二级质谱(MS2)中混合,即二级质谱的子离子来源于多个母离子,而且碎片离子还会受到未被打碎的母离子的干扰,DIA数据复杂度太大,直接分析极其困难。
目前蛋白质组学领域分析DIA数据的方法主要包括:基于数据库搜索的工作流和基于统计检验的软件来进行蛋白质鉴定和定量分析;使用深度学习的方法对蛋白质进行鉴定和定量分析。
深度学习法区别于传统蛋白质鉴定方法,它基于算力的支持,对大量数据集进行训练,让机器自主学习到数据的内在规律及特征,主要包括:
1.DeepNovo-DIA:2017年李明等人提出的[Tran N H,Zhang X,Xin L,et al.Denovo peptide sequencing by deep learning[J].Proceedings of the NationalAcademy of Sciences of the United States of America,2017.114(31):201705691.]DeepNovo-DIA结合了肽段从头测序法和深度学习,直接从DIA谱图中识别出肽段的氨基酸序列。
2.DIA-NN:2019年剑桥大学生物化学系和米尔纳治疗学研究所等多家机构合作[Demichev V,Messner C B,Vernardis S I,et al.DIA-NN:neural networks andinterference correction enable deep proteome coverage in high throughput[J].Nature Methods,2020,17(1):41-44.]提出了一种方便的集成软件包DIA-NN,它利用深层神经网络和新的定量及信号校正策略来处理DIA蛋白质组学的实验结果。DIA-NN提高了传统DIA蛋白质组定性和定量的能力,特别在高通量应用方面具有快捷的优势,与快速色谱方法结合使用时能够对蛋白质实现准确的深度覆盖。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门大学,未经厦门大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110425032.6/2.html,转载请声明来源钻瓜专利网。