[发明专利]一种基于复杂网络结构可控性基因的识别方法有效
申请号: | 201910576809.1 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110504004B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 金海燕;曹甜;王炳波;王婉宁 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 杜娟 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 网络 结构 可控性 基因 识别 方法 | ||
本发明提供了一种基于复杂网络结构可控性基因识别方法,在于构建可控性节点分类框架,将基因分成控制角色差异的不同类型,通过统计显著性识别新的基因,基于可控性节点分类框架的基因识别方法考虑了网络中的全局信息,从多个控制层面实现了基因的分类,并且将该框架应用于组织特异的调控网络中,能够系统性地检测出具有显著生物意义的基因,为进一步的基因研究提供工具平台。
技术领域
本发明属于生物信息学领域,涉及一种基于复杂网络结构可控性基因识别方法。
背景技术
基因是决定生物外在表征的内在因素并具有重要的生物意义。对这些有生物意义的基因的鉴定有两种方法。第一种方法是实验技术,如基因敲除技术,通过使特定基因的功能丧失作用,观察生物体的生命活动是否出现异常,进而推测出该基因的生物功能。实验技术昂贵且耗时,而且并不适用于所有生物体。第二种方法是生物信息学计算方法,通过基于生物网络的计算方法来分析基因的重要性。与实验技术相比,计算方法更高效,也更便宜。随着高通量技术的发展,可以很容易获得大量的基因交互数据和表达数据,从而构建各类生物网络。因此,如何从生物网络中识别这些基因成为了研究的热点。
复杂网络的发展为生物基因的研究提供了新的思路。一个生物系统可以建模为一个复杂网络。以基因调控网络为例,最常用的网络建模为有向图。网络中的节点代表基因,节点之间的有向边代表基因间的调控关系。在计算方法上,大量基于复杂网络拓扑结构的方法已经被广泛研究。这些方法大多通过度量网络节点的中心性来识别重要基因。最典型的是度中心性方法,一个节点的度中心性被定义为与之直接相连的节点的个数,根据中心性致命性规则,基因的度越大认为该基因越重要。据此对网络中的基因进行排序,排名靠前的基因作为候选基因。这些方法在不同的网络中有着一定的有效性,但是考虑的信息比较局限,忽略了节点的邻居节点之间的相互作用,因此在很大程度上对于复杂的网络不适应。
发明内容
本发明的目的提供一种基于复杂网络结构可控性基因识别方法,在于构建可控性节点分类框架,将基因分成控制角色差异的不同类型,通过统计显著性识别新的基因。
一种基于复杂网络结构可控性基因识别方法,包括如下步骤:
步骤1:读取组织特异调控网络的数据
原始数据中每行包含两列数据,分别表示调控基因和被调控基因;
步骤2:利用四种不同的节点分类方法分别对网络中的节点做分类
第一种是基于可控性的节点分类方法;
第二种是基于控制能力的节点分类方法;
第三种是基于控制功能来源的节点分类方法;
第四种是基于控制边鲁棒性的节点分类方法;
步骤3:将步骤2中四种分类结果结合起来,对网络中的每个节点的类型用一个四维向量来表示,形成可控性节点分类框架;
步骤4:在多个金标准数据集上利用统计显著性公式找出一类具有显著生物意义的基因作为候选基因;
步骤5:利用相关性度量指标从步骤4中的候选基因中筛选出特异基因。
步骤1具体为:
读取组织t的基因调控网络数据,原始网络数据包含两列,第一列是调控基因第二列是被调控基因,进行ID映射以及转化为邻接矩阵并保存。用N×N阶的邻接矩阵A=(aij)N×N来表示:
其中,i,j表示网络中基因i调控基因j的一条有向边,E是网络中的边集。
步骤2中,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910576809.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:ATE快速获取存储器失效地址的方法
- 下一篇:数据处理方法