[发明专利]一种基于贝叶斯网络推理的基因间交互关系挖掘方法有效
申请号: | 201811157185.1 | 申请日: | 2018-09-30 |
公开(公告)号: | CN109411023B | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 刘建晓;向宇嘉;田宗霖;郝松林;张小龙 | 申请(专利权)人: | 华中农业大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/00 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 崔友明 |
地址: | 430070 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 贝叶斯 网络 推理 基因 交互 关系 挖掘 方法 | ||
1.一种基于贝叶斯网络推理的基因间交互关系挖掘方法,其特征在于,包括以下步骤:
步骤1、获取基因表达量和特定表型数据,对其进行正态化处理,利用高斯核概率密度估计量估测熵的方法,分别计算基因与基因间、基因与表型性状以及表型与表型性状间互信息;
步骤2、在计算节点间互信息和条件互信息的基础上,利用三阶段依赖分析贝叶斯网络结构学习方法,构建包含基因与表型性状节点的贝叶斯网络结构;
步骤3、在步骤2中构建的包含基因与表型性状节点的贝叶斯网络结构网络图的基础上,利用贝叶斯网络参数学习方法学习得到各个节点的条件概率,得到条件概率表;
步骤4、在步骤3所得条件概率表的基础上,利用吉布斯抽样贝叶斯网络近似推理方法计算不同个数的基因与表型性状间条件概率,根据计算结果大小得到影响特定表型性状的基因间交互关系;
步骤2中的三阶段依赖分析贝叶斯网络结构学习方法的具体包括Drafting,Thickening和Thinning三个步骤;
步骤2中的Drafting,Thickening和Thinning三个步骤具体方法为:
步骤2.1、Drafting,将基因与表型性状作为网络中节点,利用高斯核概率密度估计量估测熵的方法计算任意两个节点之间的互信息,将互信息大于阈值的节点间的边添加到集合S中,然后根据互信息值的大小对S中节点对进行排序;然后对S中节点对进行循环判断,如果这两个节点之间存在开放路径,则将该节点对加入到集合R中;否则,将该节点对对应的边插入到图中,构造一个初始网络有向图;
步骤2.2、Thickening,条件互信息判断,在通过步骤2.1构建初始网络结构图的基础上,对Drafting阶段得到的集合R中节点对进行循环,查找能够D-分离该节点对的条件割集Cutset,然后利用条件独立性测试判断该节点对是否条件独立;如果条件不独立,将两个节点用有向边相连;否则,对集合R中下一节点对进行循环判断;
步骤2.3、Thinning,检查构造的图边集中的每一条边e,暂时移开e,在当前图中查找能够D-分离e连接两个节点的最小割集Cutsetmin,利用条件独立性测试判断两个节点在最小割集Cutsetmin条件下是否独立;如果条件独立,则删除e;否则,将e重新添加到网络图中,得到基因与表型性状节点的贝叶斯网络。
2.根据权利要求1所述的基于贝叶斯网络推理的基因间交互关系挖掘方法,其特征在于,步骤4的具体方法为:
步骤4.1、利用Quantile方法对基因表达和表型数据进行n值离散化处理,将同一基因的表达和特定表型数据划分为n个区间;
步骤4.2、利用吉布斯抽样贝叶斯网络近似推理方法计算任意多个基因与表型性状间条件概率;然后对这些条件概率进行求和,得到多个基因对表型性状的影响大小。
3.根据权利要求1所述的基于贝叶斯网络推理的基因间交互关系挖掘方法,其特征在于,步骤2.1中利用高斯核概率密度估计量估测熵的方法计算任意两个节点之间的互信息的方法具体为:
用p(x)表示变量X=x的概率,对于基因或表型性状变量X,用信息熵H(X)度量X的平均不确定性,其公式为:
计算变量X和变量Y的联合熵,其公式为:
基于条件概率熵,计算变量X与Y的互信息,其公式为:
MI(X,Y)=H(X)+H(Y)-H(X,Y)
同时计算给定Z条件下X与Y的条件互信息,其公式为:
MI(X,Y|Z)=H(X,Z)+H(Y,Z)-H(Z)-H(X,Y,Z)
采用高斯核概率密度估计量估测熵的方法计算节点间互信息,得到:
其中,C表示变量的协方差矩阵,|C|表示矩阵C的行列式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中农业大学,未经华中农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811157185.1/1.html,转载请声明来源钻瓜专利网。