[发明专利]基于混合蛙跳算法识别关键蛋白质的方法有效

专利信息
申请号: 201811643461.5 申请日: 2018-12-29
公开(公告)号: CN109727637B 公开(公告)日: 2023-09-05
发明(设计)人: 雷秀娟;杨晓琴;赵杰 申请(专利权)人: 陕西师范大学
主分类号: G16B20/00 分类号: G16B20/00;G16B40/00
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 徐文权
地址: 710119 陕西*** 国省代码: 陕西;61
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 混合 蛙跳 算法 识别 关键 蛋白质 方法
【说明书】:

发明公开了一种基于混合蛙跳算法识别关键蛋白质的方法,通过将蛋白质相互作用网络转化为无向图、获取蛋白质对应的亚细胞定位信息、蛋白质复合物参与信息以及功能注释信息、对蛋白质相互作用网络中结点和边进行处理、根据蛋白质结点的局部平均连通性初始化青蛙种群、根据青蛙的适应值划分族群、青蛙在族群中进行元进化,执行局部搜索、所有青蛙进行全局思想交流,执行全局搜索、产生关键蛋白质。本发明方法能准确地识别关键蛋白质;仿真实验结果表明,灵敏度、特异性、F测度、阳性预测值、阴性预测值以及正确率等指标较优;与其他关键蛋白质识别方法相比,将混合蛙跳算法的优化特性与蛋白质相互作用网络的拓扑特征以及蛋白质自身的生物特性进行结合来识别关键蛋白质,提高了关键蛋白质的识别准确率。

技术领域

本发明属于生物信息技术领域,具体涉及一种基于混合蛙跳算法识别关键蛋白质的方法。

背景技术

蛋白质是组成生物体一切细胞、组织的重要成分,是生命活动的主要承担者。不同的蛋白质在生物体细胞中参与不同的生命活动,因此,蛋白质被分成两大类,关键蛋白质和非关键蛋白质。关键蛋白质也叫致死蛋白质,关键蛋白的缺失会导致细胞无法正常繁殖或者死亡,进而使得生物体丧失某些功能,甚至无法生存。对关键蛋白的识别是生命科学中的一项重要研究内容,正确识别关键蛋白质不仅有助于理解生物体的运作机理,而且对于疾病诊断和药物设计也具有十分重要的应用价值。

在生物学上,关键蛋白质的识别主要是采用一些生物实验的方法,例如单基因敲除,RNA干扰、条件性基因剔除等。然而这些方法耗时耗力,代价极高,而且适用的物种范围有限。随着高通量技术的发展,大量的生物数据可获取,以及计算机技术的快速发展,使得利用计算生物学的方法来识别关键蛋白质成为该领域新的发展方向。目前,利用计算方法识别关键蛋白质主要可分为两类:基于网络拓扑的方法和基于生物信息融合的方法。

大量研究表明,一个蛋白质结点是否关键与该结点在蛋白质相互作用网络中的拓扑特性密切相关。基于此,已经提出了一系列利用结点的中心性测度来识别关键蛋白质的方法。如度中心性(Degree Centrality,DC),介数中心性(Betweenness Centrality,BC),接近度中心性(Closeness Centrality,CC),特征向量中心性(Eigenvector Centrality,EC),信息中心性(Information Centrality,IC),子图中心性(Subgraph Centrality,SC)等。随着对网络拓扑特性的深入挖掘分析,更多基于结点的拓扑特性的关键蛋白质识别方法被提出。Wang等人提出了一种新的中心性测度方法NC,该方法通过计算边聚集系数同时考虑了结点的特性以及结点与它的邻居之间的关系,从而来预测蛋白质的关键性;Li等人提出了一种局部平均连通性方法(LAC),该方法将每个结点的邻居结点生成一个新的子图,根据每个结点在子图中的度来识别关键蛋白质;Qi等人提出了局部相互作用密度方法(LID),该方法基于每个结点的邻居结点之间的相互作用关系来识别关键蛋白质。这些基于网络拓扑的中心性测度方法在很大程度上依赖于蛋白质相互作用网络的可靠性,而通过高通量生物实验的方法获得的蛋白质相互作用网络数据包含有大量的假阳性,这极大地影响了关键蛋白质识别的准确率。

为了克服基于网络拓扑的方法识别关键蛋白质所存在的缺陷,一些研究者结合蛋白质的生物意义,提出了一些基于生物信息融合的方法用于关键蛋白质的识别。如关键蛋白质识别方法PeC和WDC结合了蛋白质结点的网络拓扑特性和基因表达数据信息;UDoNC关键蛋白识别方法将蛋白质相互作用网络与蛋白质结构域信息整合起来;TEO在蛋白质相互作用网络中融合了蛋白质的功能注释信息和基因表达信息;SON结合了亚细胞定位信息、直系同源信息以及蛋白质相互作用网络的拓扑特性。此外,研究表明,蛋白质复合物和关键蛋白质之间存在着密切的关系,Hart等人通过实验证实了关键蛋白质通常富集于某些具有特定功能的复合物中。因此,一些基于蛋白质复合物的关键蛋白质识别方法被提出,如UC,LIDC和LBCC等。实验结果显示,这些在蛋白质相互作用网络中整合了生物信息数据的方法比之前仅基于网络拓扑结构的方法的识别效果要好,有效地提高了关键蛋白质的识别准确率。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811643461.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top