[发明专利]一种基于先验知识和网络拓扑特性的关键蛋白预测方法有效
申请号: | 201210513154.1 | 申请日: | 2012-12-04 |
公开(公告)号: | CN102945333A | 公开(公告)日: | 2013-02-27 |
发明(设计)人: | 李敏;张含会;王建新 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F19/18 | 分类号: | G06F19/18 |
代理公司: | 长沙正奇专利事务所有限责任公司 43113 | 代理人: | 马强 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于先验知识和网络拓扑特性的关键蛋白预测方法。基于对已知关键蛋白之间拓扑关系的分析发现关键蛋白之间联系紧密,将边聚集系数作为评估两个关键蛋白紧密程度的参数,并利用部分已知关键蛋白,以及其邻居节点与这些已知关键蛋白之间的共簇系数来预测新的关键蛋白。本发明实现简单,只需根据PPI信息和部分已知关键蛋白信息就能够较准确地预测未知关键蛋白,既能用于非加权PPI网络,也能用于加权PPI网络,解决了化学实验方法成本昂贵、耗时等问题。 | ||
搜索关键词: | 一种 基于 先验 知识 网络 拓扑 特性 关键 蛋白 预测 方法 | ||
【主权项】:
一种基于先验知识和网络拓扑特性的关键蛋白预测方法,其特征在于,该方法的步骤为: 1)输入蛋白相互作用信息,用k表示已知的关键蛋白节点数,n表示蛋白相互作用信息网络中关键蛋白的数量,即k个已知关键蛋白加上预测出来的关键蛋白; 2)根据蛋白相互作用信息构建无向图G:输入一组蛋白相互作用信息,过滤其中重复的相互作用和自相互作用,构建无向图G;其中G=(V,E),V代表蛋白节点集合,E代表蛋白相互作用集合; 3)生成初始的关键蛋白候选集合NK:用候选关键节点集合P存储预测的关键蛋白质,初始化所述关键节点集合P为空集;用集合K存储k个已知的关键蛋白,关键蛋白候选集合NK=Nv∩(V‑K),v∈K;Nv为节点v的所有邻居节点的集合; 4)计算共簇系数并以此扩展所述候选关键节点集合P:若所述关键蛋白候选集合NK为非空集,分别计算所述关键蛋白候选集合NK中的节点与所述集合K的共簇系数,取出共簇系数最大的一个节点v,放入所述集合K和所述候选关键节点集合P中,同时更新所述关键蛋白候选集合NK;若所述关键蛋白候选集合NK为空集,分别计算集合V‑K中的节点与所述集合K的共簇系数,取出共簇系数最大的一个节点u,放入所述集合K和所述候选关键节点集合P中,同时更新所述关键蛋白候选集合NK; 5)判断|P|是否等于(n‑k),则是,进入步骤6),若否,返回步骤4),其中|P|表示扩展后的候选关键节点集合P中的元素个数; 6)输出扩展后的候选关键节点集合P中的所有节点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210513154.1/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用
G06F 电数字数据处理
G06F19-00 专门适用于特定应用的数字计算或数据处理的设备或方法
G06F19-10 .生物信息学,即计算分子生物学中的遗传或蛋白质相关的数据处理方法或系统
G06F19-12 ..用于系统生物学的建模或仿真,例如:概率模型或动态模型,遗传基因管理网络,蛋白质交互作用网络或新陈代谢作用网络
G06F19-14 ..用于发展或进化的,例如:进化的保存区域决定或进化树结构
G06F19-16 ..用于分子结构的,例如:结构排序,结构或功能关系,蛋白质折叠,结构域拓扑,用结构数据的药靶,涉及二维或三维结构的
G06F19-18 ..用于功能性基因组学或蛋白质组学的,例如:基因型–表型关联,不均衡连接,种群遗传学,结合位置鉴定,变异发生,基因型或染色体组的注释,蛋白质相互作用或蛋白质核酸的相互作用