[发明专利]一种同源四倍体自然群体的连锁不平衡分析模型的构建方法有效

专利信息
申请号: 201410013164.8 申请日: 2014-01-10
公开(公告)号: CN103699815B 公开(公告)日: 2017-06-13
发明(设计)人: 姜立波;邬荣领;冯思思 申请(专利权)人: 北京林业大学
主分类号: G06F19/12 分类号: G06F19/12
代理公司: 北京市广友专利事务所有限责任公司11237 代理人: 张仲波
地址: 100083 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种同源四倍体自然群体的连锁不平衡分析模型的构建方法,包括对来自自然群体中一组同源四倍体植物,设置一个位点A和一个位点B;两个位点产生16单倍型,且分别都具有35种基因型,但在遗传上每个位点能够识别的四倍体基因型有只有15种,因此两个位点共产生225种基因型;从所述自然群体中随机抽取n个同源四倍体个体,得到不同基因型个体数量;根据单体型频率计算相应的配子频率,并根据配子频率计算计算相应的基因型频率;计算基因型频率;计算单倍型基因频率;通过单倍型基因频率获取两个位点的等位基因的估算频率;通过单倍型基因频率计算每两个位点间的连锁不平衡系数;然后进行验证。
搜索关键词: 一种 同源 四倍体 自然 群体 连锁 不平衡 分析 模型 构建 方法
【主权项】:
一种同源四倍体自然群体的连锁不平衡分析模型的构建方法,其特征在于,包括:步骤1、对于来自自然群体中一组同源四倍体植物,设置一个位点A和一个位点B;其中该位点A具有4个等位基因记为A1,A2,A3,A4;该位点B具有4个等位基因记为B1,B2,B3,B4;其中p1,p2,p3,p4为位点A的基因频率,且p1+p2+p3+p4=1;其中q1,q2,q3,q4为位点B的基因频率,且q1+q2+q3+q4=1;两个位点产生16单倍型表示为A1B1,A1B2,A1B3,A1B4,A2B1,A2B2,A2B3,A2B4,A3B1,A3B2,A3B3,A3B4,A4B1,A4B2,A4B3,A4B4。基因连锁不平衡系数表示为Dij,其代表Ai和Bj的连锁不平衡系数,i=1,2,3,4;j=1,2,3,4,下同;单倍型AiBj频率表示为pij;步骤2、从所述自然群体中随机抽取n个同源四倍体个体,得到不同基因型个体数量nu/v;步骤3、根据单体型频率计算相应的配子频率,并根据配子频率计算计算相应的基因型频率为pu/v;如基因型为A3/B12的同源四倍体,其包含的基因型有A3A3A3A3B1B1B1B2,A3A3A3A3B1B1B2B2,A3A3A3A3B1B2B2B2,其基因型频率p3/12=2p331+3p312p322+2p31p323;步骤4、估算参数,未知单倍型频率Ω=(pij),根据如下似然函数值计算:log L(Ω)=∑nijlog(pij)     (1)由(1)获得单倍型频率的最大似然估计p^ij=14n(nij)---(2)]]>让nu/v表示含有单倍型AiBj的基因型的个体数量,pu/v表示含有单倍型AiBj的基因型频率,pij表示pu/v中含有需要估算的单倍型AiBj的基因型频率;基因型中含有需要估算的单倍型并且只含有此单一的单倍型的同源四倍体的数量由mu/v表示;;需要估算的单倍型为AiBj的个体数量为nij=Σmu/v+Σkφknu/v---(3)]]>其中φk=pijpu/v---(4)]]>其中k是与u,v相关的自然数;根据公式(2)和公式(4)组成EM算法的一个循环;将单倍型频率的初始值来计算在E步骤的公式(4)中φk的估算值;然后使用所计算出的φk的估算值带入M步骤的公式(2)来估算单倍型频率;重复进行E和M步骤,直至单体型频率估计收敛,得到单倍型基因频率的估算值;根据以下公式,通过单倍型基因频率获取两个位点的等位基因的估算频率;p^1p^11+p^12+p^13+p^14p^2p^21+p^22+p^23+p^24p^3p^31+p^31+p^33+p^34p^4p^41+p^42+p^43+p^44q^1p^11+p^21+p^31+p^41q^2p^12+p^22+p^32+p^42q^3p^13+p^23+p^33+p^43q^4p^14+p^24+p^34+p^44]]>根据以下公式,通过单倍型基因频率计算每两个位点间的连锁不平衡系数;D^11p^11-(p^11+p^12+p^13+p^14)(p^11+p^24+p^34+p^41)D^12p^12-(p^11+p^12+p^13+p^14)(p^21+p^22+p^23+p^24)D^13p^13-(p^11+p^12+p^13+p^14)(p^31+p^32+p^33+p^34)D^14-D^11-D^12-D^13D^21p^21-(p^21+p^22+p^23+p^24)(p^11+p^12+p^13+p^14)D^22p^22-(p^21+p^22+p^23+p^24)(p^24+p^22+p^23+p^24)D^23p^23-(p^21+p^22+p^23+p^24)(p^31+p^32+p^33+p^34)]]>D^24-D^21-D^22-D^23D^31p^31-(p^31+p^32+p^33+p^34)(p^11+p^12+p^13+p^14)D^32p^32-(p^31+p^32+p^33+p^34)(p^24+p^22+p^23+p^24)D^33p^33-(p^31+p^32+p^33+p^34)(p^31+p^32+p^33+p^34)D^34-D^31-D^32-D^33D^41-D^11-D^21-D^31D^42-D^12-D^22-D^32D^43-D^13-D^23-D^33D^44D^11+D^12+D^13+D^21+D^22+D^23+D^31+D^32+D^33]]>步骤5、根据以下公式验证估计分布与实际分布是否存在显著性差异;H0:D11=D12=D13=D21=D22=D23=D31=D32=D33=0;H1:Not H0             (5)其中H0为同源四倍体各位点不存在连锁不平衡系数;通过最大似然估计,分别估算和波浪线对应的零假设的最大似然估计,抑扬符号对应的备择假设的最大似然估计;通过以下公式计算对数似然比的统计学检验LR=-2[lnL(Ω~)-lnL(Ω^)]---(6)]]>LR是遵循χ2分布,自由度是9;将计算得到的LR进行卡方检验,判断得到的LR值经卡方检验是否呈显著差异,如果呈显著差异则最终结果为H0,如果不呈显著差异则最终结果为H1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京林业大学,未经北京林业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201410013164.8/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top