[发明专利]结合网络聚类方法的全局多网络比对方法有效
申请号: | 202010449468.4 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111599406B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 陈璟;黄佳 | 申请(专利权)人: | 江南大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 吴竹慧 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 网络 方法 全局 | ||
本发明公开了一种结合网络聚类方法的全局多网络比对方法。本发明一种结合网络聚类方法的全局多网络比对方法,包括:步骤1.读取蛋白质相互作用网络数据和不同物种间的序列相似性数据,以及设定参数α和β,构建蛋白质相互作用网络G和序列相似性网络S;步骤2.对序列相似性数据进行预处理,利用参数β将序列相似性得分较小的边删除,得到过滤后的网络Ssubgt;β/subgt;;步骤3.计算所有网络中每一个节点的权重;步骤4.在相应搜索的图中,采用网络聚类算法生成候选簇。本发明的有益效果:本发明采用的方法能够达到不错的比对效果,且能够产生在拓扑和生物功能意义上都不错的比对结果。
技术领域
本发明涉及全局多网络比对领域,具体涉及一种结合网络聚类方法的全局多网络比对方法。
背景技术
21世纪以来,不同研究领域,如社交网络、商业交易和分子生物学等,可获得的数据量都出现了爆炸式增长。将蛋白质及其相互作用以网络(图)的形式表示并研究新的策略对其进行分析,是目前的一个研究热点。在蛋白质相互作用网络中,节点表示蛋白质,边表示两个蛋白质之间的相互作用。
基于蛋白质相互作用网络的比对研究较为广泛,主要分为成对(两个网络)网络比对和多(三个及以上)网络比对。早期的网络比对算法多为成对比对,旨在寻找两个网络中相似度最高的映射节点。自2008年起网络比对的研究逐渐转移到多网络比对算法上,多网络比对算法可以同时得到多个网络间节点的映射关系,因此多网络比对能够获得更加深入的生物意义。
由于网络比对问题可看为子图同构问题,因此网络比对是NP-完全问题,一直以来网络比对通过采用启发式方法来解决这个问题。早期多使用贪心算法进行比对,经过多年发展越来越多的方法用于网络比对当中,例如,匈牙利算法、种子与扩展匹配方法、模拟退火算法、遗传算法等等,近几年也有采用深度学习方法用来解决网络比对问题。
传统技术存在以下技术问题:
1、蛋白质相互作用网络的全局多网络比对研究起源于2009年,由Liao(IsoRankN:spectral methods for global alignment of multiple protein networks[J].Bioinformatics,25(12):i253-i258.)等人提出的IsoRankN算法。它通过建立不同网络间节点的相似性得分矩阵,再利用频谱聚类方法生成多网络比对结果。但是作为一个早期的算法,它与近几年新提出的多网络比对算法相比,在拓扑意义和生物功能意义上大多略逊一筹。由于这是一个经典的多网络比对算法,后期提出的许多算法还是会以此方法为标准进行比较。
2、2013年Sahraeian(SMETANA:Accurate and Scalable Algorithm forProbabilistic Alignment of Large-Scale Biological Networks[J].Plos One,8(7):e67995)等人提出的SMETANA算法。首先利用半马尔科夫随机游走模型计算不同网络节点间的相似得分矩阵,再通过两次概率一致性转移提高节点间的比对概率,最后利用贪心的种子与扩展方法构建最终比对。许多数据集的实验结果表明SMETANA是一个能够获得较好拓扑结果的多网络比对算法,但是其获得较好拓扑意义(较高的保守边比例)是以部分节点间的功能相似性为代价的,也就是说SMETANA大多只能够获得拓扑意义较好而生物功能意义欠佳的比对结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010449468.4/2.html,转载请声明来源钻瓜专利网。