[发明专利]一种采用改进的HITS算法识别关键蛋白质的方法有效
申请号: | 201811481161.1 | 申请日: | 2018-12-05 |
公开(公告)号: | CN109616153B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 雷秀娟;王思果;赵杰 | 申请(专利权)人: | 陕西师范大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 西安通大专利代理有限责任公司 61200 | 代理人: | 徐文权 |
地址: | 710119 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 采用 改进 hits 算法 识别 关键 蛋白质 方法 | ||
本发明将蛋白质相互作用网络转化为有向图、对蛋白质相互作用网络的边的预处理、网络拓扑加权边、网络生物特性加权边、利用HITS算法得到结点权威值和中心值、结点权威值和中心值归一化处理、得到每个结点的综合得分、产生关键蛋白质。本发明通过仿真实验来验证本发明的识别效果,实验结果分别使用敏感性、特异性、阳性预测值、阴性预测值、精确率和召回率调和值、精确值等指标来评价本发明中的方法;并将本发明跟其他识别关键蛋白质的方法做对比,结果表明本发明采用改进的HITS算法识别关键蛋白质的方法具有较好的性能,从以上评价指标来看本发明优于其他方法。
技术领域
本发明属于生物信息技术领域,涉及在蛋白质相互作用网络中识别关键蛋白质的方法,具体涉及一种采用改进的HITS算法识别关键蛋白质的方法。
背景技术
众所周知,蛋白质是细胞生理代谢途径的主要组成部分对生物体很重要。蛋白质参与各种生物过程,通过与其他蛋白质或DNA的相互作用实现几乎所有的细胞功能。随着蛋白质组学在后基因组时代的发展,一些与蛋白质相关的课题已经成为很热门的话题,包括蛋白质结构和功能的发现、识别关键蛋白质或蛋白质复合物的鉴定和功能模块。值得注意的是,仅去除其中一个关键蛋白质就会导致生命机体发生致命缺陷。此外,最近的一些研究结果表明关键蛋白质与人类疾病基因相关并在预测药物靶点方面具有重要作用。因此,识别重要关键蛋白质是至关重要的,这有助于帮助我们了解细胞生命的最低要求,并找到新的方法来治疗疾病。
迄今为止,许多基于生物学实验的方法和基于网络的方法已经被用来预测关键蛋白质。基于传统的生物实验方法,如基因敲除,RNA干扰和条件敲除等,虽然可以准确预测关键蛋白质,但它们耗时且昂贵。随着高通量技术的发展,如酵母双杂交,质谱分析,串联亲和纯化等技术的发展,出现了大量可用的蛋白质相互作用(PPI)数据。为了突破生物实验的约束,一些研究人员基于可用的PPI数据提出了各种计算方法。一些研究表明,PPI网络中高度连接的蛋白质往往是关键蛋白质,这称为中心致死规则。PPI网络中缺乏高度连接的蛋白质节点可能导致整个网络结构的崩溃,并对生物体本身产生致命的影响。受这些研究结果的启发,提出了各种中心性指标,如度中心性(Degree Centrality,DC),介数中心性(Betweenness Centrality,BC),紧密度中心性(Closeness Centrality,CC),特征向量中心性(Eigenvector Centrality,EC),信息中心性(Information Centrality,IC),子图中心性(Subgraph Centrality,SC)和局部平均联通(Local Average Connectivity,LAC)。尽管这些方法可用于识别关键蛋白质并提高了识别效率,但由于PPI数据中假阳性和假阴性的比例较高,它们在某种程度上具有某些缺陷。
为了弥补PPI网络的不足,一些研究者开始通过整合其他生物数据来加权PPI网络,包括基因表达数据、蛋白复合物信息、亚细胞定位信息、蛋白质同源物信息等。Li和Peng等人分别结合PPI网络和基因表达数据提出了两种鉴定关键蛋白质的方法命名为PeC和WDC。一些研究表明关键蛋白质更有可能聚集在蛋白复合物中,基于这一观点Li等人提出了两种结合蛋白复合物信息去识别关键蛋白质的方法分别为UC和改进UC-P。此外,最近许多研究发现,亚细胞定位可能在鉴定关键蛋白质中起重要作用。Tang等人提出了一种名为CNC的方法,将亚细胞定位信息整合在一起以提高识别关键蛋白质的精度。由于关键蛋白质绝大部分具有保守性,因此Li等人提出了一种结合同源物信息的方法去识别关键蛋白质,命名为SON。最近,Peng等人将蛋白质在PPI网络中的域特征与拓扑特性相结合提出了一种新的预测方法UDoNC。同时,Xu等人提出了将多个数据源加权PPI网络的重要度排名方法去识别关键蛋白质。
虽然上述研究者提出了大量的方法去识别关键蛋白质,但是识别精度和效率依然不是很高,而且大多数方法都是需要分析参数对方法的影响,缺乏对方法的整体性认识,并且大部分的方法都是将PPI网络转化为无向图,没有考虑到加权过程中的方向性。所以这一课题仍然值得我们进一步研究和探讨。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于陕西师范大学,未经陕西师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811481161.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:癌症特异的共调网络建立方法及装置
- 下一篇:测序深度的矫正方法及装置