[发明专利]基于正反库特征信息匹配的蛋白质二级质谱鉴定方法有效
申请号: | 201510799926.6 | 申请日: | 2015-11-19 |
公开(公告)号: | CN105527359B | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 陈晓舟;肖传乐;李华梅;陈君华 | 申请(专利权)人: | 云南民族大学 |
主分类号: | G01N30/72 | 分类号: | G01N30/72 |
代理公司: | 广州天河恒华智信专利代理事务所(普通合伙)44299 | 代理人: | 张培祥 |
地址: | 650504 云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 正反 特征 信息 匹配 蛋白质 二级 鉴定 方法 | ||
技术领域
本发明涉及蛋白质二级质谱鉴定领域,特别是涉及一种基于正反库特征信息匹配的蛋白质二级质谱鉴定方法。
背景技术
串联质谱技术(LC-MS/MS)被广泛应用于复杂蛋白质混合物的鉴定及定量研究中。在一次传统的LC-MS/MS实验中,酶解后得到的多肽混合物经强阳离子交换色谱及反相色谱后分离后,所得肽段根据自身疏水性不同依次流入生物质谱,利用电喷雾技术或激光解吸技术使进入质谱仪的肽段电离并碎裂,同时测定相应碎片离子的质量信息,然后选择峰强度最高的前几个碎片离子产生相应的MS/MS图谱,所得MS/MS图谱(参见图1所示)将被蛋白质二级质谱鉴定算法解析,推测出该实验图谱对应的肽段序列。
由于一次蛋白质组实验能产生大量的MS/MS图谱,所获图谱数据具有如下特点:①实验图谱中碎片峰信息丰富且复杂:首先,生物质谱仪器本身可产生大量的噪声;其次,碎片峰类型具有多样性,肽段在生物质谱中碎裂的过程是随机的,碎片峰的类型与肽段碎裂位置有关,不同的碎裂位点可产生不同类型的碎片峰;最后,峰强度的复杂性,一张实验图谱中有效碎片峰数约占30%,其峰强度的高低能很好的反应碎片峰的可靠性,大量统计表明,峰强度越高,其对应碎片峰的有效性则越好。但是,低峰度且有效的碎片峰在实验图谱中不可避免的存在,极大影响了图谱数据的精确解析。②同位素峰的普遍存在:MS/MS图谱中单电荷与多电荷共存,是不同离子的同位素峰之间存在着复杂重叠的情况。③生物质谱仪器本身的误差:不同的误差精度可较大程度上影响数据库搜索的效率和精度。因此,如何快速且有效的解析海量图谱信息是后续生物学分析研究的前提,蛋白质二级质谱鉴定算法为准确、快速推测MS/MS氨基酸序列构成开启了新的篇章。
目前,大多数蛋白质二级质谱鉴定算法都是针对于诱导碰撞解离(Collision-Induced Dissociation,简称“CID”)下产生的MS/MS图谱而设计的。在质谱实验中,带上电荷的肽段通过质谱仪可以检测到其质荷比,然而为了更为准确的鉴定肽段,通常还需要对肽段进行碰撞碎裂,对肽段碎裂而产生的碎片离子进行二级质谱扫描。肽段的碎裂一般是利用能量较低的惰性气体诱导碰撞,基于诱导碰撞解离方式的生物质谱仪在内部有一个空腔,在这里利用电场可以捕获特定质荷比的肽段,然后通过改变射频电压使得特定的质荷比肽段离子跟碎裂腔中的惰性气体进行碰撞,从而使肽段离子中的化学键断裂,产生碎片离子,再通过质量分析仪器可以得到串联质谱,也就是二级质谱。一般来说肽段的碎裂位置会在化学能量键较低的位置断裂,产生N端b离子以及C端y离子,同时也会产生部分附属的亚离子,b-H2O,b-NH3,y-H2O及y-NH3。因此,正确的认识和理解碎片离子的结构和相应的理化性质是构建蛋白质二级质谱鉴定算法的前提。
由于生物质谱技术的应用使得碎片离子的质荷比信息是可知的。因此,实验肽段序列信息可通过实验图谱与理论图谱之间的匹配进行重构(见图3)。在很长一段时间内,M/Z值常被作为主要的信息而融入到蛋白质二级质谱鉴定算法中,并以此对肽段数据库或被翻译后的核酸数据库进行搜索,获取可能的候选肽段。其中代表算法软件有:Sequest,Mascot和X!Tandem。数据库搜索的核心思想是:首先将实验图谱与产生的理论图谱进行比对,从而获取可能的候选肽段,并对产生的候选肽段基于相似度或概率打分,得分最高且与其他候选肽段得分有显著差异的候选肽段作为最终的匹配结果(见图2)。
打分函数是蛋白质二级质谱鉴定算法的核心,不同的算法会结合不同的MS/MS特征信息,提出不同的打分模型,并以此提升算法的可靠性和灵敏度。近来算法文献报道可以看出,模型构建过程中原有特征信息的单一性已被改善,即除考虑M/Z特征信息外,其他相关图谱特征信息也会被融入算法构建及打分函数中,比如:碎片峰的匹配个数、碎片峰的强度特性、匹配氨基酸的理化性质、碎片离子区分度等,这些隐含在图谱中的特征信息在最近发表的鉴定算法ProVerB,Dispec,SQID,MassWiz中有着不同程度的体现。但是基于正反库前提下,探究不同类型碎片离子在不同质量误差范围及强度区间下基于正反库匹配特性在现有蛋白质二级质谱鉴定算法中均被忽略。
发明内容
基于此,有必要提供一种能明显提高蛋白质有效质谱数量和蛋白质肽段数量的基于正反库特征信息匹配的蛋白质二级质谱鉴定方法。
一种基于正反库特征信息匹配的蛋白质二级质谱鉴定方法,包括如下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南民族大学,未经云南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510799926.6/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置