[发明专利]基于分治整合策略的成对蛋白质相互作用网络比对方法在审
申请号: | 202011528447.8 | 申请日: | 2020-12-22 |
公开(公告)号: | CN112669907A | 公开(公告)日: | 2021-04-16 |
发明(设计)人: | 陈璟;刘晓 | 申请(专利权)人: | 江南大学 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 郭磊 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分治 整合 策略 成对 蛋白质 相互作用 网络 方法 | ||
1.一种基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,包括:
步骤1:读取源网络和目标网络及BLAST相似性文件;
步骤2:采用基于结点和路径相结合的方法分别计算两个网络中结点的相似性得分,结合所述相似性得分分别对两个网络进行模块划分;
步骤3:获取同源蛋白对,根据同源蛋白对和BLAST相似性分别计算来自不同网络模块间的相似性;根据相似性将来自不同网络的模块进行一对一匹配;
步骤4:根据特征向量中心性和BLAST相似性计算每对已匹配模块中结点间的相似性,并进行模块内比对,将得到的子比对结果合并为候选结果集;
步骤5:对候选结果集使用超图匹配算法得到最终一对一比对结果。
2.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤2中,计算相似性得分具体如下:
采用度和最短路径长度衡量两个结点间的相似性,结点相似性计算如公式(1)
其中G为网络,u,v为G中的结点,degu指结点u的度,degG指图G中的最大度,D(G)指图G的直径,dG(u,v)指结点u,v的最短路径长度。
3.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤2中,模块划分步骤如下:
(1)对源网络G使用公式(1)进行相似性计算,得到相似性矩阵S;
(2)对于矩阵S中的每一行,根据数值大小,将相似性在前75%的结点构成一个模块,模块中心为该行矩阵的行名。
4.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤3具体如下:
生成同源蛋白对,并根据蛋白对在模块中的集体行为计算模块的同源相似性,使用公式(2)将同源蛋白对文件转换为同源矩阵π,其中i,j分别为来自两个网络的蛋白质;
则根据矩阵π得到的模块m1,m2的同源相似性得分为:
公式(3)受限于公式(4):
模块相似性计算公式为:
S(m1,m2)=HS(m1,m2)+BLAST(c1,c2) (5)
其中c1,c2分别为模块m1,m2的簇中心;BLAST为序列相似性;
根据公式(5)得到模块间相似性矩阵S,对S使用匈牙利算法求解,则可得到一对一的模块匹配关系。
5.如权利要求1所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,步骤4具体如下:对于模块比对阶段得到的每一对匹配上的模块,首先计算模块内结点的相似性矩阵,再对两个模块内的结点进行比对;更具体过程如下:
根据特征向量中心性和序列相似性计算不同模块中两个结点间的相似性,见公式(6)
其中T(u,v)表示结点u,v的特征向量中心性相似得分,其计算方法见公式(7):
其中cu指结点u的特征向量中心性;
将所有配对模块生成的子比对合并为候选集,此时的候选集中一个结点可能会和来自另一个网络中的多个结点形成比对关系,因此候选集为多对多匹配集合。
6.如权利要求5所述的基于分治整合策略的成对蛋白质相互作用网络比对方法,其特征在于,根据公式(6)进行模块内比对步骤如下:(1)首先将模块m1,m2的模块中心c1,c2比对上;(2)分别获取c1,c2的邻居,Deg(c1),Deg(c2);(3)从F中提取行名和列名在Deg(c1)和Deg(c2)中的子矩阵,并使用匈牙利算法将Deg(c1),Deg(c2)结点进行比对;(4)将已扩展结点(c1,c2)移除,并对剩余已比对结点对依次重复步骤(2)(3)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011528447.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗老化聚丙烯母料及其生产方法
- 下一篇:一种鸡肉气泡粒及其制备方法