[发明专利]基于层次聚类的蛋白质相互作用网络全局比对方法在审
申请号: | 202010838335.6 | 申请日: | 2020-08-19 |
公开(公告)号: | CN111916149A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 陈璟;田盼盼 | 申请(专利权)人: | 江南大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 许燕萍 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 层次 蛋白质 相互作用 网络 全局 方法 | ||
1.一种基于层次聚类的蛋白质相互作用网络全局比对方法,其特征在于,包括以下步骤:
步骤1:输入两个生物网络G1、G2,获取网络结构数据及其序列相似性文件,将蛋白质看做节点,节点i、节点j分别属于两个网络,考虑节点本身以及邻居节点的拓扑特征计算节点对(i,j)间的拓扑相似性得分T(i,j),根据序列相似性文件计算节点对的序列相似性得分B(i,j),结合拓扑相似性得分T(i,j)和序列相似性得分B(i,j)计算节点相似性得分S(i,j);
步骤2:采用层次聚类算法提取功能模块,采用组合优化算法比对功能模块,筛选出节点对作为种子;
步骤3:计算种子的邻居节点的结构相似性得分score(i,j),根据score(i,j)选择节点对加入种子集合,不断扩展种子直到覆盖所有可能的节点对,得到扩展集;
步骤4:构建二分图对剩余节点对比对,将比对结果合并到扩展集中,得到最终的比对集,即为最终找出的网络G1、G2中节点间的一对一的映射关系的集合。
2.根据权利要求1所述的基于层次聚类的蛋白质相互作用网络全局比对方法,其特征在于:所述步骤1中结合拓扑相似性和序列相似性构成节点相似性的步骤为:
步骤1-1:获取两个输入网络G1=(V1,E1),G2=(V2,E2),V1、V2表示节点集合,节点表示蛋白质;E1、E2表示边集合,边表示蛋白质间的相互作用;N(i)、N(j)为节点i和节点j的直接相连的邻居节点的集合;拓扑相似性得分考虑了节点本身和节点的邻居节点的拓扑相似性,计算节点i、j的拓扑相似性得分T(i,j)的过程如下:
首先,初始化T0(i,j)=1;其次,构建二分图Gb=(Vb,Eb),其中Vb由N(i)的节点和N(j)的节点的两个不相交集合组成,Eb中的边(i',j')由N(i)、N(j)中节点所有可能的连接组成,其中i'∈N(i),j'∈N(j),边的权重w(i',j')=Tt(i',j');接着,找到Gb的匹配集合M;最后,计算该匹配M对应的Tt+1(i,j)值:
其中,d(i)、d(j)表示节点i、j的度,MaxD表示在G1、G2所有节点中度的最大值,t是预设的迭代次数,θ是平衡邻居节点和节点本身拓扑相似性比重的参数,0≤θ≤1;多次迭代后,Tt+1(i,j)的最终值T(i,j)即为节点的拓扑相似性得分;
步骤1-2:根据序列相似性文件计算节点对的序列相似性得分B(i,j):
其中,blast(i,j)表示节点i、j之间的BLAST bit-score得分,即序列相似性文件中的值;Minb表示G1、G2网络中节点对的BLAST bit-score得分的最小值,Maxb表示网络中节点对的BLASTbit-score得分的最大值;
步骤1-3:结合拓扑相似性得分T(i,j)和序列相似性得分B(i,j),计算节点相似性得分S(i,j):
S(i,j)=α×B(i,j)+(1-α)×T(i,j)
其中,α是平衡拓扑和序列权重的参数,0≤α≤1。
3.根据权利要求2所述的基于层次聚类的蛋白质相互作用网络全局比对方法,其特征在于:所述步骤1-1中找到Gb的匹配集合M的方法为采用贪心算法,具体过程为先选中权重最大的边加入到匹配集合M中,其中每一条边对应一组节点的映射关系,再删除这条边连接的两个节点及其相连的其他边,接着重复上述步骤,直到图中没有可选择的边,则比对结束,得到最终的匹配集合M。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010838335.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水产养殖用水面绿萍清除设备
- 下一篇:一种方块形卤氧化铋光催化剂制备方法