[发明专利]结合网络聚类方法的全局多网络比对方法有效
申请号: | 202010449468.4 | 申请日: | 2020-05-25 |
公开(公告)号: | CN111599406B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 陈璟;黄佳 | 申请(专利权)人: | 江南大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 吴竹慧 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 网络 方法 全局 | ||
1.一种结合网络聚类方法的全局多网络比对方法,其特征在于,包括:
步骤1.读取蛋白质相互作用网络数据和不同物种间的序列相似性数据,以及设定参数α和β,构建蛋白质相互作用网络G和序列相似性网络S;
步骤2.对序列相似性数据进行预处理,利用参数β将序列相似性得分较小的边删除,得到过滤后的网络Sβ;
步骤3.计算所有网络中每一个节点的权重,根据节点的度和邻居节点,将度小的节点和边的权重转移到度较大的节点和边上;
步骤3具体如下:
(a)为网络中的节点和节点间的边设置初始值;
(b)将节点度为1的节点的权重转移到它的邻居节点和边上;
(c)将节点度大于1且小于10的节点权重转移到它的邻居节点和边上;
(d)根据节点的权重和与之相连的边的权重计算节点在网络中的重要性得分,λ表示计算节点权重时,相关边的权重得分对于节点权重的影响大小;
计算每个节点相关的序列同源得分;
(e)计算网络中每一个节点的最终权重得分;
Weight(u)=α×importance(u)+(1-a)×B(v) (8)
(f)结合聚类方法搜索比对:
根据序列相似性信息可以构建一个加权k分完全图S,其中节点表示的是相应网络中的节点,来自不同物种网络的两节点之间边的权重为序列相似性bit score值;在相似图S中通过网络聚类方法,将相似的节点聚集在一个簇中;
步骤4在相应搜索的图中,采用网络聚类算法生成候选簇;
步骤5计算当前候选比对簇的目标函数得分,选择得分最高的候选比对簇作为比对结果;
步骤6输出比对结果,并对比对结果进行分析。
2.如权利要求1所述的结合网络聚类方法的全局多网络比对方法,其特征在于,步骤1具体如下:
首先,读取用户设定的用来决定拓扑和序列相似性所占比重的参数α和用来过滤序列相似性信息的参数β;其次确定输入网络个数k,并对蛋白质相互作用网络进行批次读取,并构建蛋白质相互作用网络G={G1,G2,…,Gk};并读取不同网络间的序列相似性信息;构建序列信息网络S。
3.如权利要求1所述的结合网络聚类方法的全局多网络比对方法,其特征在于,步骤2具体如下:
根据读取的阈值系数β,对序列相似性信息进行过滤;首先由于序列相似性的信息量巨大,随着网络数增多数据量呈指数级增长,随之计算难度也会增大;其次由于目前许多真实物种的序列相似性信息不完整,某些序列信息可能会影响比对结果的准确性;因此在使用序列相似性辅助比对过程时,需要对序列信息进行过滤;对于序列信息网络S中任一条边(u,v),若其边的得分小于相应边相关的阈值,则删除网络S中的这条边,最终得到经过过滤的网络Sβ:
w(u,v)<β×max(u,v) (1)。
4.如权利要求1所述的结合网络聚类方法的全局多网络比对方法,其特征在于,步骤3中,此处为基于种子与扩展方法的聚类方法,分为以下几个步骤:
(a)计算当前搜索网络中节点的加权度,并选择加权度最大的节点作为第一个种子加入集合S;
(b)将第一个种子邻居的权重归一化,并选择权重最高的作为第二个种子加入S;
(c)根据前两步生成的种子对在网络中进行扩展,选择与S中节点相接权重和最大的节点,满足两个约束条件则添加节点,否则结束扩展;当生成了新的候选簇,若簇中包含的节点来源网络数小于输入网络数,对当前簇进行扩展,提高约束条件,即增大Td,Ts的值;
。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010449468.4/1.html,转载请声明来源钻瓜专利网。