[发明专利]基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法有效

专利信息
申请号: 201210358669.9 申请日: 2012-09-25
公开(公告)号: CN102902896A 公开(公告)日: 2013-01-30
发明(设计)人: 谢江;谭军;马进;张武;文铁桥 申请(专利权)人: 上海大学
主分类号: G06F19/24 分类号: G06F19/24
代理公司: 上海上大专利事务所(普通合伙) 31205 代理人: 何文欣
地址: 200444*** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法。其步骤如下:A、根据生物分子的序列特征,构建网络T(Gt)和B(GB)中生物分子的初始相似矩阵。B、根据生物分子在网络中的拓扑的相似特征,计算生物分子的相似矩阵S。C、构建专家知识字典。D、基于专家知识,以邻居优先策略进行搜索,获得结果子网。E、计算结果子网R(Gr)与目标子网T(Gt)的相似得分。F、计算p值。G、结果子网可视化。与同类方法相比,该方法计算准确度更高,具有更高的稳定性,能更好地处理生物分子网络间的“空隙”(Gap),获得更多的保守边和节点,且能较好地反映生物分子网络之间的变化情况。
搜索关键词: 基于 专家 知识 拓扑 相似 邻居 优先 生物 分子 子网 搜索 方法
【主权项】:
1.基于专家知识与拓扑相似的邻居优先生物分子子网搜索方法,其特征在于,对于网络A(GA)、网络B(GB)及A中的目标子网T(Gt),基于专家知识,同时考虑网络中生物分子及其在网络中的拓扑相似属性,以邻居节点优先的策略进行网络搜索,以在网络B(GB)中获得与网络T(Gt)在生物意义上最相似的结果子网R(Gr);具体操作步骤如下:A、计算Gt和GB的初始相似矩阵:根据生物分子的序列特征,构建网络T(Gt)和网络B(GB)中生物分子的初始相似矩阵,其中的每个元素表示节点和节点之间的序列相似系数,其具体步骤如下:A1、取,其余参数取缺省值,用BLAST计算中所有分子在的序列相似分子;A2、按以下公式计算这些生物分子之间的相似系数:B、计算Gt和GB的相似矩阵S:根据生物分子在各自网络中的拓扑相似特征,计算生物分子的相似矩阵S,矩阵中的每个元素为节点和节点之间的相似系数;C、构建专家知识字典:字典中包含了网络T(Gt)和网络B(GB)中由专家确定的最相似的生物分子对;D、采用邻居节点优先策略进行网络搜索:利用专家知识,基于相似矩阵S,以邻居优先策略进行搜索,获得结果子网;E、计算结果子网(Gr)与目标子网(Gt)的相似得分;其相似得分定义如下:设目标子网为,结果子网为,其中,分别代表网络的节点集合,且12,即网络中有1个节点,网络2个节点;表示节点存在于网络中,分别表示结果子网中与对应的节点;分别代表网络的边集合,表示边的两个端点是节点表示边是网络的一条边;表示边的权重;表示网络的节点和结果子网中与其对应的节点的序列相似系数;则结果子网相对于目标子网的得分为在无向图中:其中 在有向图中:其中F、计算p值,分析目标子网的统计学意义,p值反映了计算结果有多大概率是由两个无关网络随机计算的结果,p值越接近于0,说明所得到的结果越显著越不可能是随机出现的结果,因此越可能具有生物学意义;反之,p值越接近于1,则所对应的结果就越不显著,越可能是由于无意义的随机计算得到的;其具体步骤如下:F1、生成网络B(GB)的n个随机网络;F2、在每个随机网络中用同样的方法搜索同一个目标子网的相似子网,得到n个结果子网;F3、用T检验计算p值; G、结果子网(Gr)可视化。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海大学,未经上海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201210358669.9/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top