[发明专利]一种用于利用测序数据将肽映射到蛋白质的计算方法在审
申请号: | 201310174311.5 | 申请日: | 2013-05-13 |
公开(公告)号: | CN103488913A | 公开(公告)日: | 2014-01-01 |
发明(设计)人: | 迈克尔·詹尼斯;于冈海瑞·锐迪 | 申请(专利权)人: | 安捷伦科技有限公司 |
主分类号: | G06F19/22 | 分类号: | G06F19/22 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 肖善强 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 利用 序数 据将肽 映射 蛋白质 计算方法 | ||
技术领域
本发明涉及蛋白质组学,尤其涉及用于利用质谱仪数据进行蛋白质分析的工作流程。
背景技术
近来对个性化医疗的推进需要对个体中的各种生物分子进行更高效的分析。这通常涉及分析病人的蛋白质组。蛋白质组可以被定义为用由基因组表达的蛋白质。蛋白质表达(既而蛋白质组)可能例如随着个体生理条件的变化或者随着病理或药物治疗的进行而因时而异。
蛋白质组分析通常利用液相色谱法(LC)结合串联质谱法(MS/MS)而被执行进行。这些技术已经成为用于蛋白质识别鉴定的重要工具,因为它们可以快速且地以高敏感度地识别鉴定复杂的蛋白质混合物。在典型的方法中,一种将蛋白质混合物被消化(通常利用胰蛋白酶)为肽,被分离分级(例如利用LC)并且通过质谱法(MS/MS)被分析。得到的胰蛋白酶片段的MS数据随后被用于推断或识别鉴定父亲本蛋白质,这可以通过自动数据库搜索来实现。
图1示出了图示蛋白质组分析的一般过程的流程图。如图所示,方法10开始于准备用于分析的样本(步骤11),该步骤可以包括蛋白质的消化(通常利用胰蛋白酶)和片段的分离。然后,对消化后的肽片段被进行质谱仪分析(步骤12),该步骤通常包括对所有肽片段的全面扫描(或者调查全谱扫描)。一些肽片段(例如,更多冗余丰度较高的片段)被进行串联质谱仪(MS/MS)分析以阐释肽序列(步骤13)。然后,使用肽序列被用于搜索数据库以识别父鉴定亲本蛋白质(步骤14)。
这种方法理论上可以实现对样本中的所有蛋白质的识别鉴定。这种方法可以被称为鸟枪法。然而,利用这种“鸟枪”法的蛋白质识别鉴定非常有难度并且需要很多资源。一种替代方法是被称为针对性蛋白质组分析的方法,在该方法中只分析目标列表中的蛋白质。
对于针对性蛋白质组分析,对质谱数据的处理通常涉及两个主要步骤:识别鉴定目标蛋白质和对目标蛋白质的质谱仪分析,如图2中所示,图2示出了方法20,该方法包括生成用于分析的目标蛋白质的列表的步骤(步骤21),接着利用质谱法(例如MS/MS)和肽到蛋白质的映射(即利用肽序列搜索数据库)进行蛋白质分析(例如利用肽序列搜索数据库;步骤22)。
目标蛋白质列表的生成(步骤21)通常基于调查全谱质谱仪分析来根据相对丰度或其它差异特性识别鉴定感兴趣的蛋白质或肽。利用MS/MS和肽映射所进行的定向肽测量(步骤22)可以包括与图1中所示的过程相同的过程,只是步骤22不同之处在于将对列表中的蛋白质执行MS/MS测量。
鸟枪蛋白质组分析方法(图1)和针对性蛋白质组分析方法(图2)都是通过利用测得的肽序列搜索数据库来识别鉴定蛋白质并且通过测得的肽丰度的集合推断蛋白质丰度。这些过程通常涉及庞大的数据库,通过该数据库经消化的肽被映射到可能的蛋白质。这种方法受到以下问题的困扰:假阳性映射和大量可能异构体的混合存在,这些可能的异构体难以仅仅根据蛋白质数据库进行辨别。因此,根据肽数据的被预测蛋白质的错误集合包含假阳性。这可能导致大量的推定的蛋白质预测,这可能是很难在生物环境中进行分析的。此外,在针对性质谱蛋白质组分析方法中,目标肽识别鉴定传统上是基于相关丰度测量的,这可能导致目标特异性的缺失。这会导致被错认为目标的肽,进而使得在MS/MS阶段的肽到蛋白质的映射变得复杂。
发明内容
本发明的一个方面涉及用于生物样本中的蛋白质组分析的方法。根据本发明的一个实施例的方法包括获取目标列表中的蛋白质的肽序列;以及通过将所获取的肽序列映射到蛋白质组数据库中的蛋白质上来识别鉴定所述生物样本中的蛋白质,其中所述目标列表利用所述生物样本中的RNA转录物的信息而被确定,并且/或者所述目标列表利用所述生物样本中的RNA转录物的信息而被确定。
根据一些实施例,肽序列可以利用质谱仪而被确定肽序列。目标列表可以利用RNA转录物的信息而被确定目标列表。
根据本发明的一些实施例,映射可以在蛋白质组数据库中的蛋白质子集上被执行映射,其中所述蛋白质子集基于生物样本中的RNA转录物的信息而被来选择所述蛋白质子集。所述被识别可以将鉴定的蛋白质可以被与所述RNA转录物的信息进行比对检查,以去除与所述RNA转录物中的任何信息都不相对应的蛋白质。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安捷伦科技有限公司,未经安捷伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310174311.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用