[发明专利]一种基于结构预测的基因调控网络构建方法有效

申请号：	201910875164.1	申请日：	2019-09-17
公开（公告）号：	CN110675912B	公开（公告）日：	2022-11-08
发明（设计）人：	王之琼;郭上慧;曲路渲;信俊昌;钱唯	申请（专利权）人：	东北大学
主分类号：	G16B5/20	分类号：	G16B5/20;G16B25/00
代理公司：	沈阳东大知识产权代理有限公司 21109	代理人：	李在川
地址：	110819 辽宁***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于结构预测基因调控网络构建方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于结构预测的基因调控网络构建方法，其特征在于，包括以下步骤：

步骤1：计算系数矩阵，通过计算基因之间的Pearson系数、互信息及最大互信息来确定基因之间的相关性，作为筛选潜在父节点集的依据；

步骤2：结构预测，利用步骤1中获得的基因之间的系数矩阵，作为判定基因潜在父节点集的依据，为每个基因选取潜在父节点集；

步骤3：结构学习，采用基于评分搜索的结构学习方法，评分函数选择BDe分数，并设置每个基因的调控集合的个数为K，对于基因x_i，以潜在父节点集P_i为搜索空间，遍历所述搜索空间内的基因可能组成的集合，对每一个所述集合计算BDe分数score，根据分数高低评判所述集合作为基因x_i的父节点集的优劣；

步骤4：局部网络合并，每个基因对应一个局部网络G_i，将[G₁，……，G_n]合并成全局网络G[[x₁,G₁],[x₂,G₂],…,[x_n,G_n]]，设基因y∈G_i，则基因x_i和基因y间的存在调控关系表示为y→x_i；

步骤5：参数学习，对于所述全局网络G中的每一条调控关系进行参数学习，所述参数包括调控作用和调控概率，所述调控作用表示为激励或抑制，所述调控概率表示调控基因与靶基因的后验概率。

2.根据权利要求1所述的一种基于结构预测的基因调控网络构建方法，其特征在于，所述的步骤1计算系数矩阵，通过计算基因之间的Pearson系数、互信息及最大互信息来确定基因之间的相关性，作为筛选潜在父节点集的依据，具体步骤如下：

步骤1.1：将基因表达数据表示为一个矩阵X(m*n)，m表示基因表达数据的样本数，n为基因总数，所述矩阵X(m*n)的每一行为一个基因的表达数据向量，具体表述为第i个基因的表达数据向量表示为X_i，定义3个系数矩阵M_Pearson(n*n)用于存放基因之间的Pearson系数的计算结果，定义M_mi(n*n)用于存放互信息的计算结果，定义M_MIC(n*n)用于存放最大互信息的计算结果；

步骤1.2：由于Pearson系数、互信息和最大互信息三种方法都具有对称性的属性，因此在计算所述3个系数矩阵时只需计算上三角矩阵，利用公式(1)计算基因x_i的表达数据向量X_i与基因x_i+1,x_i+2,…,x_n的表达数据向量X_i+1,X_i+2,…X_n的皮尔逊系数，将计算得到的皮尔逊系数存放到M_Pearson(n*n)中，具体为M_Pearson[i，i+1]，M_Pearson[i，i+2]，……，M_Pearson[i，n]，同时将计算得到的皮尔逊系数复制到对应的下三角，具体为M_Pearson[i+1，i]，M_Pearson[i+2，i]，……，M_Pearson[n，i]，最终得到M_Pearson的整个矩阵表达式；

式中，r(X_i,Y)表示基因x_i的表达数据向量X_i和基因y的表达数据向量Y的皮尔逊系数，基因y∈{x_i+1,x_i+2,…,x_n}，X_ip表示基因x_i的表达数据向量X_i的第p个样本表达值，Y_jp表示基因y的表达数据向量Y的第p个样本表达值，表示基因x_i的表达数据向量X_i的样本平均值，表示基因y的表达数据向量Y的样本平均值，m表示基因表达数据的样本数；

步骤1.3：利用公式(2)计算基因x_i的表达数据向量X_i与基因x_i+1,x_i+2,…,x_n的表达数据向量X_i+1,X_i+2,…X_n的互信息的值，将计算得到的互信息值存放到M_mi(n*n)中，具体为M_mi[i，i+1]，M_mi[i，i+2]，……，M_mi[i，n]，同时将计算得到的互信息值复制到对应的下三角，具体为M_mi[i+1，i]，M_mi[i+2，i]，……，M_mi[n，i]，最终得到M_mi的整个矩阵表达式，

式中，I(X_i,Y)表示基因x_i的表达数据向量X_i和基因y的表达数据向量Y的互信息值，基因y∈{x_i+1,x_i+2,…,x_n}，|C(X_i)|表示基因x_i的表达数据向量X_i的协方差矩阵的行列式的值，|C(Y)|表示基因y的表达数据向量Y的协方差矩阵的行列式的值，|C(X_i,Y)|表示向量X_i和向量Y的协方差矩阵的行列式；

步骤1.4：利用公式(3)计算基因x_i的表达数据向量X_i与基因x_i+1,x_i+2,…,x_n的表达数据向量X_i+1,X_i+2,…X_n的最大互信息的值，将计算得到的最大互信息值存放到M_MIC(n*n)中，即M_MIC[i，i+1]，M_MIC[i，i+2]，……，M_MIC[i，n]，同时将计算得到的最大互信息值复制到对应的下三角，具体为M_MIC[i+1，i]，M_MIC[i+2，i]，……，M_MIC[n，i]，最终得到M_MIC的整个矩阵表达式，

式中，mic(X_i,Y)表示基因x_i的表达数据向量X_i和基因y的表达数据向量Y的最大互信息值，基因y∈{x_i+1,x_i+2,…,x_n}，I(X_i,Y)表示所述基因x_i的表达数据向量X_i和基因y的表达数据向量Y的互信息值，a表示坐标轴X轴方向上的网格化的大小，b表示坐标轴Y轴方向上的网格化的大小，参数B取值为B＝m^0.6，其中m表示基因表达数据的样本数。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910875164.1/1.html，转载请声明来源钻瓜专利网。

上一篇：DDR修复方法、装置、终端和存储介质
下一篇：一种基于HLA分型与结构的肿瘤新抗原的筛选方法

同类专利

专利分类

G 物理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于结构预测的基因调控网络构建方法有效

专利文献下载