[发明专利]一种蛋白质组学中肽段的肽段定量效率预测方法有效
申请号: | 201810216313.9 | 申请日: | 2018-03-16 |
公开(公告)号: | CN108491690B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 付岩;常乘;高志强;朱云平 | 申请(专利权)人: | 中国科学院数学与系统科学研究院;中国人民解放军军事科学院军事医学研究院;北京蛋白质组研究中心 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B40/00 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 蛋白质 组学中肽段 定量 效率 预测 方法 | ||
1.一种蛋白质组学中肽段的肽段定量效率预测方法,其步骤包括:
1)筛选出高可信蛋白,将高可信蛋白的鉴定肽段作为高可信肽段;
2)计算所述高可信肽段的物理化学性质和肽段定量效率;其中,所述肽段定量效率为肽段的质谱信号强度对肽段的真实量的反应程度;设定同一蛋白的不同肽段具有相同的真实量,且每个肽段的定量效率与该肽段的质谱信号强度成正比;计算所述肽段定量效率的方法为:对于每一所述高可信蛋白i,首先计算该高可信蛋白i的信号强度最高的肽段的定量效率;Qi,j表示高可信蛋白i的肽段j的肽段定量效率,Qi,max=maxj Qi,j表示高可信蛋白i的信号强度最高的肽段的定量效率;其中,通过公式计算Qi,max的估计值作为Qi,max;ni表示高可信蛋白i的期望肽段数目;然后利用公式计算所述高可信蛋白i的其他鉴定肽段的肽段定量效率;其中,Ii,j为高可信蛋白i的肽段j的质谱信号强度,Ii,max为高可信蛋白i的所有肽段的质谱信号强度中的最大值;
3)基于高可信肽段的物理化学性质和肽段定量效率,构建预测肽段定量效率模型的训练集;然后利用该训练集训练得到肽段定量效率预测模型;
4)利用所述肽段定量效率预测模型预测鉴定蛋白的各鉴定肽段的肽段定量效率。
2.如权利要求1所述的方法,其特征在于,所述高可信蛋白为至少包含N个唯一肽段的蛋白;所述唯一肽段是指在已鉴定到的蛋白中唯一在一个蛋白组出现的肽段;所述蛋白组是指经过蛋白装配之后得到的同组蛋白集合。
3.如权利要求1所述的方法,其特征在于,构建所述训练集的方法为:将高可信肽段的物理化学性质作为训练集的自变量,将高可信肽段的肽段定量效率作为训练集的因变量,构建所述训练集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院数学与系统科学研究院;中国人民解放军军事科学院军事医学研究院;北京蛋白质组研究中心,未经中国科学院数学与系统科学研究院;中国人民解放军军事科学院军事医学研究院;北京蛋白质组研究中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810216313.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于转录组的肿瘤新抗原鉴定方法
- 下一篇:亲缘关系鉴定方法及终端设备