[发明专利]一种基于线性混合模型的基因调控网络推断方法在审

申请号：	202211571759.6	申请日：	2022-12-08
公开（公告）号：	CN115831228A	公开（公告）日：	2023-03-21
发明（设计）人：	呼加璐;廉斌;张浩晖;尚学群	申请（专利权）人：	西北工业大学
主分类号：	G16B25/10	分类号：	G16B25/10;G16B5/00;G16B45/00;G16B40/00;G06F18/23
代理公司：	西安凯多思知识产权代理事务所(普通合伙) 61290	代理人：	刘涛
地址：	71007***	国省代码：	陕西;61
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于线性混合模型基因调控网络推断方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于线性混合模型的基因调控网络推断方法，其特征在于，包括如下步骤：

步骤1：使用线性混合模型表示基因表达数据：

Y＝M+G+E；G～MN_p×n(0，V_g，K)，E～MN_p×n(0，V_e，I_n×n)， (1)

其中，Y是p×n维的预处理后的基因表达矩阵，p是基因的数量，n是细胞的数量；矩阵M代表Y的均值，矩阵M中的值M_ij表示第i个基因在每个细胞中表达的平均值，因此M每列的元素相同；G是一个p×n维的随机效应矩阵变量，服从矩阵正态分布，均值为0，行协方差矩阵表示为p×p维的V_g，V_g表示基因之间相关性，列协方差矩阵是一个已知的n×n维的矩阵K，表示细胞与细胞间表达的相关性，能够通过先验信息计算得到；E是p×n维的噪声矩阵，均值为0，行协方差矩阵表示为p×p维的V_e，列协方差矩阵是单位矩阵；

步骤2：将Y中减去均值，即用表示Y的方差部分

步骤3：对矩阵K进行特征分解，即其中U_k是n×n维的特征向量正交矩阵，D_k是n×n维的由相应特征值填充的对角矩阵；

步骤4：对矩阵Y、G、E进行转换并向量化：

g＝vec(GU_k)，e＝vec(EU_k)，vec表示向量化，即把每列按顺序连接成一个向量；

步骤5：线性混合模型变为：

其中，MVN表示多元正态分布，表示克罗内克积；

对于每个细胞i，有：

y_i＝g_i+e_i；g_i～MVN(0，δ_iV_g)，e_i～MVN(0，V_e)， (3)

其中，V_g和V_e是未知的参数；

步骤6：似然函数推导；为了求解未知参数V_g和V_e，首先推导出对数似然函数，然后用PX-EM算法对其进行估计；

步骤6-1：似然函数：

其中l(y_i|g_i，V_g，V_e)是y中第i个细胞的似然函数，l(g_i|V_g，V_e)是g的第i个细胞的似然函数；