[发明专利]基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法有效
申请号: | 201410399487.5 | 申请日: | 2014-08-14 |
公开(公告)号: | CN104156603B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 王建新;钟坚成;李敏 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 长沙市融智专利事务所43114 | 代理人: | 黄美成 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法。该方法基于相互作用蛋白质间的存在概率亦相互影响的现象,在鸟枪法蛋白质组学数据上融合蛋白质相互作用网络信息,定义了新的蛋白质鉴定图模型,利用图模型中蛋白质的存在概率及其所获得的邻居蛋白质结点的支持度来调整肽映射到蛋白质的概率,从而调整蛋白质的存在概率。该方法能识别大部分的蛋白质,与其它鉴定方法比较,具有较的高的精确度。为生物学家通过蛋白质组学数据推断和鉴定蛋白质的实验以及进一步研究提供有价值的参考信息。 | ||
搜索关键词: | 基于 蛋白质 相互作用 网络 鉴定 方法 | ||
【主权项】:
一种基于蛋白质相互作用网络和蛋白质组学的蛋白质鉴定方法,其特征在于,包括以下步骤:步骤一:通过质谱识别软件比较理论质谱图和实验质谱图,得到肽的存在概率Probpep_i,过滤概率小于0.05的肽;步骤二:根据过滤后的肽建立肽映射蛋白质的二分图Gv(Ni,Mj,E),其中Ni为肽结点集合,Mj为蛋白质结点集合,E为表示肽和蛋白质映射关系的边的集合;输入一组蛋白质相互作用数据,过滤掉其中的重复相互作用和自相互作用数据,在二分图上蛋白质侧建立蛋白质相互作用无向图Gu(Nu,E′),其中Nu为蛋白质结点集合,Nu结点集合与二分图中Mj结点集合相同,E′为表示蛋白质相互作用信息的边的集合;步骤三:计算Gv中蛋白质的存在概率Probpro_j:Probpro_j=[1-Πi∈Gv;(i,j)∈E(1-Probi_j)]-log(Deg(pro_j)Theory(pro_j)]]>其中,Probpro_j表示蛋白质j的存在概率,Probi_j表示肽i映射到蛋白质j的概率,根据公式计算得到,其中Probpep_i表示肽i的存在概率,Deg(pep_i)表示二分图Gv中i结点的度;Deg(pro_j)表示蛋白质j所包含的实际肽的匹配数,即为二分图Gv中j结点的度;Theory(pro_j)表示按某种酶切方式,蛋白质j所包含的理论肽的匹配数;所述度是指和该结点相关联的边的条数;步骤四:计算蛋白质j所获得的邻居蛋白质结点的支持度Supportpro_j:Supportpro_j=Σk∈Gu;(k,j)∈E′Probpro_k*Weight(k,j)]]>其中Probpro_k表示在Gu上蛋白质j的邻居蛋白质结点k的存在概率,Weight(k,j)表示蛋白质k与蛋白质j的相互作用权值;如果步骤二中输入的蛋白质相互作用数据是加权的,则Weight(k,j)依据蛋白质相互作用数据确定;如果步骤二中输入的蛋白质相互作用数据是非加权的,则令Weight(k,j)=1;计算蛋白质j的每个邻居蛋白质结点的贡献度,计算公式为:Probpro_k*Weight(k,j),判断其是否大于设置的阈值,若低于设置的阈值,认为该邻居蛋白质结点的贡献度为假阳性,则在计算蛋白质j所获得的邻居蛋白质结点的支持度时,不考虑该邻居蛋白质;步骤五:调整共享肽i映射到蛋白质j的概率Probi_j:Probi_j=Supportpro_j*Probpro_jSumSupportpep_i]]>其中,SumSupportpep_i表示共享肽i所映射到的所有的蛋白质所获得的支持度之和,计算公式为:Supportpro_j表示蛋白质j所获得的邻居蛋白质结点的支持度,Probpro_j表示蛋白质j的存在概率;根据调整后共享肽i映射到蛋白质j的概率Probi_j,利用步骤三中的公式重新计算蛋白质的存在概率Probpro_j;步骤六:判断蛋白质的存在概率是否收敛,即检查本次计算得到的蛋白质的存在概率与上一次计算得到的蛋白质存在概率有没有变化;如果没有变化,则输出蛋白质的存在概率列表;否则转步骤四。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410399487.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用