[发明专利]基于多组学丰度信息的蛋白质二级质谱鉴定方法有效

专利信息
申请号: 201610737420.7 申请日: 2016-08-26
公开(公告)号: CN106404878B 公开(公告)日: 2019-03-19
发明(设计)人: 谢尚潜;肖传乐;谢志 申请(专利权)人: 中山大学中山眼科中心
主分类号: G01N27/62 分类号: G01N27/62
代理公司: 广州华进联合专利商标代理有限公司 44224 代理人: 万志香
地址: 510060 *** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于多组学丰度信息的蛋白质二级质谱鉴定方法。该基于多组学丰度信息的蛋白质二级质谱鉴定方法包括如下步骤:1)利用转录组或翻译组多组学的丰度信息数据和实验图谱数据的初步鉴定结果,构建初步鉴定蛋白和多组学丰度信息的对应关系;2)通过初步关系评估多组学丰度信息的蛋白鉴定能力;3)将多组学丰度信息的蛋白鉴定能力融入到实验图谱和理论图谱的肽段打分中,选择得分最高的肽段作为此实验图谱的最终鉴定结果。基于多组学丰度信息的蛋白质二级质谱鉴定方法的鉴定有效质谱量和蛋白质肽段数均高于目前的算法,同时能多核并行快速运行,鉴定效率大大提高。
搜索关键词: 基于 多组学丰度 信息 蛋白质 二级 鉴定 方法
【主权项】:
1.一种基于多组学丰度信息的蛋白质二级质谱鉴定方法,其特征在于,包括如下步骤:(1)将转录组或翻译组的二代测序碱基序列定位到参考基因组,根据定位到的位置获得每个基因的丰度信息;具体包括:(2.1)利用Fanse2软件获得多组学序列的比对结果信息,包括正反链、染色体名称和染色体位置信息,分别记为r_strand、r_chrom和r_pos,提取所有已知基因注释信息的染色体名、起始位置、终止位置和正反链,记为g_chrom、g_start、g_end和g_strand;(2.2)初始化每个基因的比对结果存储数组gene_read=0,读取一个序列的r_strand、r_chrom和r_pos信息,把该序列的信息与所有基因的信息比较,判断该序列是否位于基因上;如果以下三个条件的同时成立,则认为序列位于基因上,此时该基因的gene_read数加1;三个条件如下:r_strand=g_strand;r_chrom=g_chrom;r_pos>=g_start并且r_pos<=g_end;(2.3)逐个读取序列的信息,重复步骤(2.2)直到处理一个样本的所有比对序列信息,其基因的存储数组中的值即为比对到各个基因上的序列数记为g_read,将数组的所有值累加即为总的序列比对数记为R_mapped,根据以下公式计算多组学基因的丰度信息FPKM值:FPKM=g_read×109/(R_mapped×g_length),其中基因长度g_length=g_end–g_start;(2)将蛋白质的质谱实验图谱利用Proverb蛋白鉴定方法进行初步鉴定,统计每个蛋白的初步鉴定结果;(3)根据基因注释信息将基因和蛋白名称一一匹配,确定基因不同程度丰度信息初步鉴定蛋白数目,并计算得到每个丰度区间的初步蛋白的鉴定概率;(4)对丰度区间的丰度值和初步蛋白鉴定概率构建丰度信息的蛋白鉴定能力模型,根据模型获得每个基因对应丰度信息的蛋白鉴定能力;(5)在蛋白质谱的实验图谱与理论图谱的打分中融入蛋白相应基因的蛋白鉴定能力,将每张实验图谱的在理论图谱中的所有匹配得分进行排序,选择最高得分的肽段作为图谱鉴定结果,并对结果进行质量控制。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学中山眼科中心,未经中山大学中山眼科中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201610737420.7/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top