[发明专利]一种基于结构预测的基因调控网络构建方法有效
申请号: | 201910875164.1 | 申请日: | 2019-09-17 |
公开(公告)号: | CN110675912B | 公开(公告)日: | 2022-11-08 |
发明(设计)人: | 王之琼;郭上慧;曲路渲;信俊昌;钱唯 | 申请(专利权)人: | 东北大学 |
主分类号: | G16B5/20 | 分类号: | G16B5/20;G16B25/00 |
代理公司: | 沈阳东大知识产权代理有限公司 21109 | 代理人: | 李在川 |
地址: | 110819 辽宁*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 结构 预测 基因 调控 网络 构建 方法 | ||
本发明提供一种基于结构预测的基因调控网络构建方法。包括以下内容:首先计算系数矩阵,通过计算基因之间的Pearson系数、互信息及最大互信息来确定基因之间的相关性,作为筛选潜在父节点集的依据;然后进行结构预测,将获得的基因之间的系数矩阵作为判定基因潜在父节点集的依据,为每个基因选取潜在父节点集;最后进行基因调控网络的结构学习和参数学习。本发明通过基于Person系数、互信息及最大互信息相结合的方法预测基因的潜在父节点集,缩小结构学习的搜索范围,在一定程度上减少了基因调控网络的构建时间,提升计算性能,可以更加快速、准确地构建大规模基因调控网络,进一步了解生物的基因调控机制。
技术领域
本发明涉及医学信息学领域,尤其涉及一种基于结构预测的基因调控网络构建方法。
背景技术
基因表达调控即一个基因的表达被其它基因影响的过程,主要包括转录水平和翻译水平上的调控。由于基因表达的最终形式是蛋白质,需要转录形成mRNA作为模板最终产生蛋白质,因此转录水平上的基因调控是关键。一个基因的转录受到另外基因表达产物的影响,起到激励或抑制作用,其本身产生的蛋白质也可能影响其它基因。这种复杂的调控关系最终构成基因调控网络。了解生物的基因调控机制,可以在遗传视角上理解各种生物过程的发生,揭示生物体的不良过程,对发现生物系统的关键原理及细节至关重要。
目前的一些基因调控网络模型在一定程度上解决了基因调控网络的构建问题,但同时也存在一些问题。如布尔模型在定性的角度上研究基因调控网络,过于粗糙和简化;微分方程模型则通过微分方程来定量、精准地描述基因调控网络,但是同时会由于参数过多造成难以优化的问题,计算量巨大。贝叶斯网络模型通过概率模型来描述基因调控网络,用概率表示调控关系,但是随着网络复杂性的提高,该模型的计算量将大幅上升。
发明内容
针对现有技术的不足,本发明的目的是提出基于结构预测的基因调控网络构建方法。全局网络的构建可以分解为针对子网络的构建问题,在每个子网络的构建过程中,由于需要查找所有剩余基因可能组成的集合来得到最优的子网络结构,计算时间会随着基因数量的增长呈指数上升趋势,因此采用基于Pearson系数、互信息及最大互信息相结合的方法来预测每个基因的可能父节点集,在这个父节点集内搜索最优结构,极大程度上减小了搜索空间,提升计算性能。
为解决上述技术问题,本发明提出了一种基于结构预测的基因调控网络构建方法,包括以下步骤:
步骤1:计算系数矩阵,通过计算基因之间的Pearson系数、互信息及最大互信息来确定基因之间的相关性,作为筛选潜在父节点集的依据;
步骤2:结构预测,利用步骤1中获得的基因之间的系数矩阵,作为判定基因潜在父节点集的依据,为每个基因选取潜在父节点集;
步骤3:结构学习,采用基于评分搜索的结构学习方法,评分函数选择BDe分数,并设置每个基因的调控集合的个数为K,对于基因xi,以潜在父节点集Pi为搜索空间,遍历所述搜索空间内的基因可能组成的集合,对每一个所述集合计算BDe分数score,根据分数高低评判所述集合作为基因xi的父节点集的优劣;
步骤4:局部网络合并,每个基因对应一个局部网络Gi,将[G1,……,Gn]合并成全局网络G[[x1,G1],[x2,G2],…,[xn,Gn]],设基因y∈Gi,则基因xi和基因y间的存在调控关系表示为y→xi;
步骤5:参数学习,对于所述全局网络G中的每一条调控关系进行参数学习,所述参数包括调控作用和调控概率,所述调控作用表示为激励或抑制,所述调控概率表示调控基因与靶基因的后验概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910875164.1/2.html,转载请声明来源钻瓜专利网。