[发明专利]基于正反库特征信息匹配的蛋白质二级质谱鉴定方法有效
申请号: | 201510799926.6 | 申请日: | 2015-11-19 |
公开(公告)号: | CN105527359B | 公开(公告)日: | 2017-10-31 |
发明(设计)人: | 陈晓舟;肖传乐;李华梅;陈君华 | 申请(专利权)人: | 云南民族大学 |
主分类号: | G01N30/72 | 分类号: | G01N30/72 |
代理公司: | 广州天河恒华智信专利代理事务所(普通合伙)44299 | 代理人: | 张培祥 |
地址: | 650504 云南*** | 国省代码: | 云南;53 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明申请公开了一种基于正反库特征信息匹配的蛋白质二级质谱鉴定方法,该算法主要通过统计不同类型实验峰与正反库理论峰在不同误差范围及强度区间下的匹配情况,进而提取出串联图谱的新特征信息并进行数学定量,最后将已被定量的新特征信息融入至蛋白质二级质谱鉴定算法打分模型。为了验证PepFind算法的可靠性,我们将利用不同质谱平台下产生的数据集对该算法进行测试,并与目前被广泛应用的商业及相关开源蛋白质二级质谱鉴定软件在FDR为1%的条件下所得鉴定结果进行对比分析,结果表明PepFind对实验图谱具有更好的鉴定量及灵敏度。本发明申请涉及的基于正反库特征信息匹配的蛋白质二级质谱鉴定方法,能明显提高蛋白质有效质谱数量和蛋白质肽段数量。 | ||
搜索关键词: | 基于 正反 特征 信息 匹配 蛋白质 二级 鉴定 方法 | ||
【主权项】:
一种基于正反库特征信息匹配的蛋白质二级质谱鉴定方法,其特征在于,包括如下步骤:(1)下载蛋白质参考序列数据库,并将蛋白质参考序列反转,得到包含正库及反库的蛋白质序列数据库;(2)虚拟酶解步骤(1)得到的所述蛋白质数据库序列,并根据酶解后肽段的质量数建立肽段质量数据库和肽段质量数据库索引;(3)对待分析实验图谱进行去除同位素峰处理,并合理的选取有效峰,提升实验图谱本身的信噪比;(4)根据待分析实验图谱中母离子去电荷后的质量数在步骤(2)所述的肽段质量数据库中找出符合要求的候选肽段,并按规则产生相应的理论图谱;(5)统计不同离子类型在不同质量误差范围及强度区间的匹配信息,对获取的统计信息进行合理的数学定量;步骤(5)具体包括如下步骤:①将不同碎片峰类型下的质量误差及峰强度分别划分为10个及5个区间,具体操作如下:a.质量误差区间:[0,0.05],[0.05,0.1],[0.1,0.15],[0.15,0.2],[0.2,0.25],[0.25,0.3],[0.3,0.35],[0.35,0.4],[0.4,0.45],[0.45,0.5]b.峰强度区间:[0,0.05),[0.05,0.1),[0,1,0,3),[0.3,23),[23,1]]]>c.碎片峰类型:b,b‑NH3,b‑H2O,y,y‑NH3,y‑H2O;②统计不同碎片峰类型在不同质量误差范围及强度区间下基于正反库下的匹配信息,即匹配个数;③定义不同碎片峰类型在不同质量误差及强度区间下基于正反库匹配的特征信息,并进行数学定量;不同碎片峰类型在不同质量误差及强度区间下权重计算公式如下:Weight=-log(1-NTargetNDecoy+NTarget)]]>其中:NTarget=正库中匹数数,NDecoy=反库中的匹配数,Weight=权重值,它是不同碎片峰类型在不同质量误差范围及强度区间下理论碎片峰与实验碎片峰识别非随机匹配造成的能力度量;j为第j个区间(j∈[1,10],j∈Z+),i为第i种离子类型(i∈b/b‑H2O/b‑NH3/y/y‑H2O/y‑NH3),N(rij)为离子类型i在区间j中正确匹配峰的数目,N(eij)为离子类型i在区间j中错误匹配峰的数目;(6)将步骤(5)中获取的定量信息融入至打分算法,选择得分最高的候选肽段作为此实验图谱的匹配结果,最后对所有实验图鉴定结果进行整体质量控制;其中打分过程包括:基于正反库特征信息的匹配打分、基于正反库特征信息的连续匹配打分以及基于正反库特征信息的b、y离子匹配打分。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于云南民族大学,未经云南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510799926.6/,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置