[发明专利]一种牦牛基因组测序数据的基因型填充方法在审
申请号: | 202111608117.4 | 申请日: | 2021-12-23 |
公开(公告)号: | CN114300043A | 公开(公告)日: | 2022-04-08 |
发明(设计)人: | 王嘉博;秦婕;钟金城;王会;柴志欣;王海波 | 申请(专利权)人: | 西南民族大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B40/00 |
代理公司: | 沈阳一诺君科知识产权代理事务所(普通合伙) 21266 | 代理人: | 刘丽娟 |
地址: | 610000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 牦牛 基因组 序数 基因型 填充 方法 | ||
1.一种牦牛基因组测序数据的基因型填充方法,其特征在于,包括以下步骤:
1)根据已有的牦牛基因型数据对牦牛群体进行聚类和归类,以分类群体作为基础群体;
2)利用隐马尔科夫模型和群体内部遗传结构关系及遗传参数,对每个分类群体内部的未知基因型可能性概率进行估计,最终以可能性最大的基因型作为最后的预测结果;
3)整合各个分类群体的基因型数据,如果依然有未知基因型数据,继续重复步骤1)至步骤2),直至全部分类群体的基因型数据得到完全填充。
2.根据权利要求1所述的牦牛基因组测序数据的基因型填充方法,其特征在于,所述步骤1)具体包括:将牦牛基因型数据的基因型多态数据SNP转换成Hapmap、bed或者numeric格式,利用现有的K-means和Cluster两种聚类方式综合判定牦牛个体的具体分类群体,即两种聚类方式同时认定个体属于同一类群,否则个体被归入单独类群。
3.根据权利要求2所述的牦牛基因组测序数据的基因型填充方法,其特征在于,所述步骤2)具体包括:
(1)分类群中的个体遗传结构采用分子遗传关系矩阵类估计,个体间的远近程度决定了个体间基因型估计的最初置信概率,遗传参数评估主要指连锁不平衡关系确定即单倍型估计,以此判断分类群中基因之间可信估计距离的远近即可信的单倍型长度;
(2)利用隐马尔可夫模型HMM计算参考面板的单倍型中一个标记到下一个标记的概率,其中参考面板指的是分类群中在其他个体未知的基因型处拥有已知基因型的多个个体;
(3)在每个标记处,用等位基因标记的概率之和作为该等位基因的估算概率;从第一个标记到最后一个标记的概率之和就是特定的单倍型概率;
(4)再根据目标样本与参考面板之间共有的基因序列建立模型,利用计算得到的参考面板中的等位基因标记的概率,预测目标样本中同样标记处各种基因型的最大可能性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南民族大学,未经西南民族大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111608117.4/1.html,转载请声明来源钻瓜专利网。