[发明专利]适用复杂性状的基因-环境交互的分析方法及存储介质有效
申请号: | 202210373636.5 | 申请日: | 2022-04-11 |
公开(公告)号: | CN114898809B | 公开(公告)日: | 2022-12-23 |
发明(设计)人: | 张纪峰;毕文健;马雨茁;赵延龙 | 申请(专利权)人: | 中国科学院数学与系统科学研究院 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/20 |
代理公司: | 合肥天明专利事务所(普通合伙) 34115 | 代理人: | 苗娟 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 适用 复杂 性状 基因 环境 交互 分析 方法 存储 介质 | ||
1.一种适用复杂性状的基因-环境交互的分析方法,其特征在于,包括以下步骤:
获取分析所需的表型数据、基因型数据、环境因素数据和混杂因素数据;
基于表型数据、基因型数据、环境因素数据和混杂因素数据,选择分析所需的广义线性回归模型,在边际遗传效应与边际基因-环境交互作用均为0的假设下拟合约束模型、估计模型参数并计算残差;
对于待检验的位点,估计其次要等位基因频率,基于score统计量检验其边际遗传效应的显著性;
根据边际遗传效应的显著性来选择并计算相应的用于检验边际基因-环境交互作用显著性的检验统计量;
对于检验边际基因-环境交互作用的检验统计量,使用正态分布近似方法与鞍点近似方法相结合的混合检验策略计算统计p值以检验边际基因-环境交互作用的显著性,从而实现全基因组范围的关联分析;
所述基于表型数据、基因型数据、环境因素数据和混杂因素数据,选择分析所需的广义线性回归模型,在边际遗传效应与边际基因-环境交互作用均为0的假设下拟合约束模型、估计模型参数并计算残差,包括:
假设参与研究的个体样本数量为n,对于个体i,1≤i≤n,令Xi表示一个k维的混杂因素向量,Gi表示基因型,Gi=0,1,2,Ei表示环境因素,Yi表示某一表型,线性预测项其中βX表示混杂因素Xi的k维系数向量,βE、βG和βG×E分别表示环境因素Ei、基因型Gi和基因-环境交互项GiEi所对应的系数,假设表型Yi的期望可以表示成ηi的函数,此假设对于GWAS中大部分的模型是成立的,对数似然函数l(βX,βE,βG,βG×E)=lnL(βX,βE,βG,βG×E)是ηi的函数,表示为的形式,其中f(.)表示某个一元函数;对于不同的复杂性状,采用与表型相对应的广义线性回归模型进行分析;
为了检验边际基因-环境交互作用的显著性,在假设Hc:βG=βG×E=0,即边际遗传效应和边际基因-环境交互作用均为0的假设下拟合模型,得到参数(βX,βE)的极大似然估计并定义残差向量
其中,f′(.)表示f(.)的一阶导数;
所述对于待检验的位点,估计其次要等位基因频率MAF,基于score统计量检验其边际遗传效应的显著性,包括:
假设待检验位点的次要等位基因频率为q,令作为q的估计;
定义基因型向量G和基因-环境交互向量GE分别为:
计算用于检验边际遗传效应的score检验统计量
并认为检验统计量在假设HG:βG=0成立时服从期望为0、方差为的正态分布,其中表示的方差的估计,令作为使用正态分布近似方法检验假设HG:βG=0得到的双侧p值,其中为的观测值,Φ(.)表示标准正态分布的累积分布函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院数学与系统科学研究院,未经中国科学院数学与系统科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210373636.5/1.html,转载请声明来源钻瓜专利网。