[发明专利]一种基于概率统计模型的蛋白质二级质谱鉴定方法有效
申请号: | 201110358552.6 | 申请日: | 2011-11-11 |
公开(公告)号: | CN102495127A | 公开(公告)日: | 2012-06-13 |
发明(设计)人: | 肖传乐;马超;刘帅;陈晓舟;何庆瑜 | 申请(专利权)人: | 暨南大学 |
主分类号: | G01N27/62 | 分类号: | G01N27/62 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 杨晓松;裘晖 |
地址: | 510632 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 概率 统计 模型 蛋白质 二级 鉴定 方法 | ||
技术领域
本发明涉及蛋白质二级质谱鉴定领域,特别涉及一种基于概率统计模型的蛋白质二级质谱鉴定方法。
背景技术
随着基质辅助激光解吸(matrix-assisted laser desorption ionization,MALDI)和电喷雾(Electrospray Ionization,ESI)两种软电离技术的出现,使生物质谱能够较少地引入杂质和保持肽段分子的完整性,从而使生物质谱大规模应用于蛋白质分析。目前,生物质谱已成为蛋白质组研究的支撑技术之一,其主要是利用串联质谱(LC MS/MS)来分析蛋白质样品。在蛋白质组的生物信息学研究中,质谱数据处理是十分重要的研究内容,其任务是从带有复杂噪声或者部分信息缺失的数据中推断样品的蛋白质组成。数据库搜索是质谱数据处理的主要方法,其基本过程如图1所示,即将实验图谱和数据库中的理论酶切图谱进行比对、打分,选择分值最高的匹配作为搜索结果后选肽段。
蛋白质二级质谱鉴定涉及到诸多方面的内容,其主要涉及到母离子价态的确定、效质谱峰的选取和匹配打分模型。目前针对鉴定结果整体质量控制的方法主要是应用随机数据库方法对整体鉴定结果进行阳性率控制,其基本思想是:先针对真实蛋白质数据库和实验数据集构建一个随机数据库,然后同时或者分别搜索真实蛋白质数据库和新构建的随机数据库,通过随机数据库肽段匹配来模拟正常数据库中的随机匹配,从而估计正常数据库中随机匹配的特征分布,确定不同过滤标准,Kall’s于2008年在Proteome上公开了一种方法,具体是采用如下公式来得到整体数据集的假阳性率(False Discovery Rate,FDR)。
目前蛋白质二级质谱鉴定算法根据匹配打分模型大致可以分为两类:解释型模型和概率统计模型。其中著名的商业软件SEQUEST的算法是解释型模型,而另一个商业软件Mascot的算法是概率统计模型。另外还有一些免费的鉴定算法,例如比较有影响力的基于统计模型的算法有X!Tandem和OMSSA。其中X!Tandem用的是超几何模型,OMSSA用的是泊松分布模型。这些基于统计模型的算法中考虑的是实验质谱峰匹配与不匹配,并没有考虑质谱峰的连续匹配情况,更较少考虑到质谱峰峰强的概率模型。在基于解释模型的算法中,其中Sequest考虑了离子连续匹配和峰强。但它统一把峰强分别定义为三个值:50(b和y离子)、25(b,y离子脱水和脱氨离子)和10(a离子),没有充分体现实验质谱离子的特征。
因此,研究一种能大大提高蛋白质有效质谱和蛋白质肽段数量的二级质谱鉴定方法具有很高的理论和实际应用价值。
发明内容
本发明的主要目的在于克服现有技术的缺点与不足,提供一种基于概率统计模型的蛋白质二级质谱鉴定方法,该方法鉴定有效质谱和蛋白质肽段的数量均高于现有算法。
本发明的目的通过以下的技术方案实现:一种基于概率统计模型的蛋白质二级质谱鉴定方法,具体包括以下步骤:
(1)虚拟酶解蛋白质数据库序列,并根据肽段的质量数对酶解后的肽段建立肽段数据库和肽段数据库索引;
(2)根据待分析实验图谱中母离子的核质比在步骤(1)所述的肽段数据库中找出符合要求的候选肽段,并对找到的所有候选肽段产生符合要求的理论图谱;
(3)对待分析实验图谱进行去同位素和去噪处理;
(4)将步骤(3)得到的待分析实验图谱和步骤(2)中得到的每张候选肽段的理论图谱进行匹配打分,选择分值最高的候选肽段作为此实验图谱的鉴定结果;
(5)针对所有实验图谱鉴定结果进行整体假阳性控制。
所述步骤(1)具体包括以下步骤:
(1-1)读取待分析二级质谱样本中物种蛋白质序列库文件的一条蛋白质序列;
(1-2)根据用户设定的蛋白酶,找到蛋白质序列中的酶切位点,在符合规则的酶切位点产生断裂,从而产生没有漏切位点的肽段或存在漏切位点的断裂肽段;
(1-3)计算步骤(1-2)所得到的各个虚拟酶切后肽段的质量数,根据每个氨基酸的分子量计算每个肽段的质量数;
(1-4)将肽段信息写入肽段数据库中以该肽段取整后质量数命名的文件中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于暨南大学,未经暨南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110358552.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:防松固紧螺栓套件
- 下一篇:热传递设备和包括热传递设备的电子外壳