[发明专利]一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法有效
申请号: | 201510092169.9 | 申请日: | 2015-03-02 |
公开(公告)号: | CN104651517B | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 盖钧镒;贺建波;孟珊;管荣展;赵团结 | 申请(专利权)人: | 南京农业大学 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68;G06F19/18 |
代理公司: | 南京知识律师事务所32207 | 代理人: | 高玲玲 |
地址: | 210095 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法,以解决传统方法无法估计复等位基因信息、假阳性率高以及在近交作物中检测功效低的问题。本发明结合基于单倍型区块构建的SNPLDB标记、近交群体关联分析模型偏差的矫正和多位点模型下二阶段关联分析策略,建立了适合于近交作物常规育种的GWAS方法。该方法将SNPLDB标记用于GWAS,为复等位基因估计提供了方法,第一阶段基于单位点模型来筛选候选位点,第二阶段基于多位点模型下的逐步回归分析方法作进一步筛选以平衡缺失遗传率和遗传率估计过高的问题,从而将最终遗传模型的解释率控制到性状遗传率。GWAS使用由SNPLDB标记估计的相似系数矩阵的特征向量和合适的显著水平来提高定位的准确性和功效。 | ||
搜索关键词: | 一种 基于 snpldb 标记 限制性 阶段 基因组 关联 分析 方法 | ||
【主权项】:
一种基于SNPLDB标记的限制性二阶段全基因组关联分析方法,其特征在于,所述方法包括如下步骤:a)构建全基因组SNPLDB标记:首先对已有种质资源群体的全基因组SNP基因型数据进行连锁不平衡分析,然后利用Haploview软件定义全基因组SNP分子标记的单倍型区块,最后将单倍型区块内的SNP分子标记合并为新的标记SNPLDB标记;b)近交群体关联分析模型偏差的矫正:直接基于构建的全基因组SNPLDB标记,计算其遗传相似系数矩阵作为亲属关系的估计,用于矫正由近交导致的GWAS模型偏差;假定群体包含n个个体,关联分析中对单个标记位点的假设测验的线性模型表示为其中yi为第i个个体的表型观测值,μ为群体平均数,wij为反应第i个个体与第j个亚群体的关系的系数,αj为第j个亚群体效应,xil取值为0或1,表示第i个个体在标记位点上的基因型,如果个体在标记位点的基因型为第l个等位基因,则xil为1,反之为0,βl为标记位点第l个等位基因的效应并假定对于单个位点有Σβl=0,εi为残差效应并服从N(0,σ2),σ2为误差方差;直接基于构建的全基因组SNPLDB标记,计算其遗传相似系数矩阵作为亲属关系的估计,该方法为EigenIBS;c)多位点模型下二阶段关联分析:第一阶段基于模型的EigenIBS方法,使用p=0.05的显著水平对所有标记进行初步筛选,筛选到的标记作为候选位点纳入第二阶段分析;第二阶段使用标准的多元逐步回归方法对候选位点进行第二轮筛选,逐步回归中使用EigenIBS方法来矫正群体偏差:首先在已入选位点条件计算所有剩余位点显著性测验的p值;然后选择低于显著水平p值最小的位点作为新位点加入模型,并重复该过程直到没有显著的位点可供选择;最后根据模型拟合包含所有入选位点的遗传模型,删除大于显著水平p值最大的位点,并重复该过程直到模型中所有位点均显著。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京农业大学,未经南京农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510092169.9/,转载请声明来源钻瓜专利网。