[发明专利]一种基于复杂网络结构可控性基因的识别方法有效
申请号: | 201910576809.1 | 申请日: | 2019-06-28 |
公开(公告)号: | CN110504004B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 金海燕;曹甜;王炳波;王婉宁 | 申请(专利权)人: | 西安理工大学 |
主分类号: | G16B20/00 | 分类号: | G16B20/00 |
代理公司: | 西安弘理专利事务所 61214 | 代理人: | 杜娟 |
地址: | 710048*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 复杂 网络 结构 可控性 基因 识别 方法 | ||
1.一种基于复杂网络结构可控性基因识别方法,其特征在于,包括如下步骤:
步骤1:读取组织特异调控网络的数据
原始数据中每行包含两列数据,分别表示调控基因和被调控基因;
步骤2:利用四种不同的节点分类方法分别对网络中的节点做分类
第一种是基于可控性的节点分类方法;
根据基于可控性的节点分类方法,将网络中的节点分为三种类型,即cr={0,1,2};实现步骤如下:
a.对于原始网络N,利用匈牙利算法计算控制网络所需的最小驱动节点集的大小,记为ND;
b.删除网络N中的节点i以及节点i所有的连边关系,得到新的网络N';
c.对于网络N',利用匈牙利算法计算控制网络所需的最小驱动节点集的大小,记为ND';
d.若ND'ND,节点i的类型cr记为0;若ND'ND,节点i的类型cr记为1;若ND'=ND,节点i的类型cr记为2;
e.重复步骤(b)到(d),直到得到网络N中所有节点的类型;
第二种是基于控制能力的节点分类方法;
根据基于控制能力的节点分类方法,将网络中的节点分为三种类型,即cc={0,1,2};节点i的控制能力的定义如下:
其中,∑MDS(i)是包含节点i的不同最小驱动节点集的个数,∑MDS是所有最小驱动节点集个数;
a.若φ(i)=1,即节点i在所有的最小驱动节点集中都出现,节点i的类型cc记为0;
b.若φ(i)=0,即节点i在所有的最小驱动节点集中都不出现,节点i的类型cc记为1;
c.若0φ(i)1,即节点i在部分的最小驱动节点集中出现,节点i的类型cc记为2;
已有研究证明,φ(i)=1的节点的充要条件是入度为零,因此只需找出φ(i)=0的节点,剩余的节点为0φ(i)1,φ(i)=0的节点是二分图中始终匹配的节点,具体识别过程如下:
a)利用匈牙利算法获取网络的一个最大匹配MMS,并将二分图的in集合中的匹配点集合记为M;
b)随机选择M中的一个节点i,找出out集合中与节点i匹配的节点j;
c)暂时删除节点i及其匹配的边,检查是否存在从节点j开始,在未匹配节点处结束的增广路径;
d)如果没有增广路径,说明节点i总是匹配的,否则,节点i是可替换的;
第三种是基于控制功能来源的节点分类方法;
根据基于控制功能来源的节点分类方法,将网络中的节点分为三种类型,即cs={0,1,2};
a.若网络中节点i的入度为零,则节点i的类型cs记为0;
b.若网络中节点i的出度为零,则节点i的类型cs记为1;
c.若网络中节点i的入度和出度均不为零,则节点i的类型cs记为2;
第四种是基于控制边鲁棒性的节点分类方法;
根据基于控制边鲁棒性的节点分类方法,将网络中的节点分为四种类型,即cl={0,1,2,3},首先给出critical边的识别过程:
a.对于原始网络N,利用匈牙利算法计算控制网络所需的最小驱动节点集的大小,记为ND;
b.删除网络中的连边e,得到新的网络N';
c.对于网络N',利用匈牙利算法计算控制网络所需的最小驱动节点集的大小,记为ND';
d.若ND'ND,则边e的类型记为critical类型;否则为其他类型;
然后给出节点的分类方法:
a)若网络中节点i有critical类型的输入边和输出边,则节点i的类型cl记为0;
b)若网络中节点i只有critical类型的输出边,则节点i的类型cl记为1;
c)若网络中节点i只有critical类型的输入边,则节点i的类型cl记为2;
d)若网络中节点i没有critical类型的边,则节点i的类型cl记为3;
步骤3:将步骤2中四种分类结果结合起来,对网络中的每个节点的类型用一个四维向量来表示,形成可控性节点分类框架;具体为:构建四维向量,形成可控性节点分类框架,根据上述四种节点分类方法,将网络中的节点类型用一个四维向量来表示ci=(cr,cc,cs,cl);
步骤4:在多个金标准数据集上利用统计显著性公式找出一类具有显著生物意义的基因作为候选基因;具体为:
根据统计显著性公式计算每种类型的基因所具有的生物意义,公式如下:
其中,N表示网络中的基因总数,M表示金标准数据集的基因总数,n表示属于同一类型的基因集合,k表示n中属于M的基因数,p值小于0.05表示具有统计意义,p值小于0.01表示显著富集;
步骤5:利用相关性度量指标从步骤4中的候选基因中筛选出特异基因。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安理工大学,未经西安理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910576809.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:ATE快速获取存储器失效地址的方法
- 下一篇:数据处理方法