[发明专利]一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法有效
申请号: | 202010318724.6 | 申请日: | 2020-04-21 |
公开(公告)号: | CN111489789B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 薛宇;周嘉琦;林少峰;王晨玮 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G16B20/30 | 分类号: | G16B20/30;G16B40/00 |
代理公司: | 华中科技大学专利中心 42201 | 代理人: | 许恒恒;李智 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提高 磷酸化 修饰 鉴定 通量 准确性 方法 | ||
1.一种提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,包括以下步骤:
(1)将预先选定的磷酸化组质谱数据库中多个样本的质谱鉴定磷酸化修饰组原始数据用多种搜库引擎按预先设定的初始假阳性率FDR要求进行重新搜库;
(2)将所述步骤(1)中多种搜库引擎鉴定到的磷酸化修饰位点进行去冗合并,得到训练集;
(3)将所述步骤(2)得到的训练集作为机器学习输入样本,该训练集中的每一个位点在每种搜库引擎当中的最高分值作为特征值,构建基于训练数据的机器学习模型;
(4)利用所述步骤(3)得到的模型,对所述步骤(2)得到的训练集中的各个磷酸化修饰位点进行重新预测或者对其他未知样本集中的各个磷酸化修饰位点进行预测,得到每个位点的打分排序,再利用该打分筛选出假阳性率FDR满足预先设定的目标假阳性率FDR要求的位点,从而得到各搜库引擎工具整合之后的总位点;
并且,所述步骤(4)中的所述预先设定的目标假阳性率FDR要求要严于所述步骤(1)中的所述预先设定的初始假阳性率FDR要求。
2.如权利要求1所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述步骤(1)中,所述多种搜库引擎为至少3种搜库引擎。
3.如权利要求2所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述步骤(2)还对所述训练集中的数据进行阳性样本和阴性样本的标记;对于任意一个数据,若被至少2种搜库引擎鉴定到,则被标记为阳性样本;否则,被标记为阴性样本。
4.如权利要求1所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述步骤(1)中,所述多种搜库引擎选自MaxQuant、pFind、MyriMatch、Comet、MS Amanda、MS-GF+、Tide、X!Tandem、OMSSA。
5.如权利要求1所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述步骤(3)中,所述训练具体是基于逻辑回归训练。
6.如权利要求1所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述方法还包括步骤:
(5)利用所述步骤(4)得到的总位点进行磷酸化修饰定量,得到磷酸化肽段强度。
7.如权利要求1-6任意一项所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述步骤(1)中的所述预先设定的初始假阳性率FDR要求为假阳性率FDR小于2%;
所述步骤(4)中的所述预先设定的目标假阳性率FDR要求为假阳性率FDR小于1%。
8.如权利要求1-7任意一项所述提高质谱磷酸化修饰位点鉴定通量和准确性的方法,其特征在于,所述步骤(1)中,所述预先选定的磷酸化组质谱数据库为PRIDE数据库和CPTAC数据库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010318724.6/1.html,转载请声明来源钻瓜专利网。