[发明专利]一种基于ADMIXTURE-MCP模型估计水产动物基因组品种组成的新方法有效
申请号: | 202010189230.2 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111354417B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 王扬帆;任强;倪萍;胡晓丽;黄晓婷;邢强;焦文倩;张玲玲;王师;胡景杰;包振民 | 申请(专利权)人: | 中国海洋大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B35/20 |
代理公司: | 青岛博展利华知识产权代理事务所(普通合伙) 37287 | 代理人: | 杨春雷 |
地址: | 266071 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 admixture mcp 模型 估计 水产 动物 基因组 品种 组成 新方法 | ||
本发明提供一种基于ADMIXTURE‑MCP模型估计水产动物基因组品种组成的新方法,属于水产动物品种组成领域,方法包括步骤:获得未知品种水产动物基因组SNP标记数据;对参考水产动物进行筛选;估计水产动物基因组品种组成。针对以往的ADMIXTURE模型对不同种扇贝的相似基因序列产生小分量的问题,本发明使用稀疏优化方法产生稀疏解来降低传统模型由基因相似性而产生的估计GBC噪音。我们发现传统L1范数约束模型产生的稀疏解不稳定,虽然可以减少ADMIXTURE小分量的问题,但估计GBC组成与真实GBC组成往往会发较大偏离。为了克服传统算法使用L1范数约束导致严重GBC估计偏差的缺陷,本发明提出使用非凸函数MCP约束来替代L1范数约束,其能够在减少GBC噪声同时,更能产生更接近无偏估计GBC结果。
技术领域
本发明属于水产动物品种组成领域,具体涉及一种基于ADMIXTURE-MCP模型估计水产动物基因组品种组成的新方法。
背景技术
利用基础科学研究推动畜牧业高质量发展并为消费者提供高质、低价和安全的畜禽产品是动物基因组学研究的出发点与落脚点。动物个体的基因组品种构成(genomicbreed composition,GBC)是指动物祖先对于动物个体基因组的遗传贡献比例。对动物个体GBC的准确估计对动物遗传学研究和育种工作具有重大意义,如可以从基因组水平实现动物亲缘关系鉴定、评估某动物品种的育成历史和品种纯度、保护地方特色品种、预测杂种优势(即评估杂交品种对特定生产环境的适应性)从而实现杂交计划和杂交育种方案的精准设计。通过系谱信息确定品种组成的传统方法具有一定的局限性,其评估的可靠性可能会受到系谱缺失、不准确或不完整记录的影响。例如,基于系谱的预估函数对于那些父母具有相同品种组成的个体会产生相同的估计值。众所周知,对于不同于F1代的杂交个体而言,由于在减数分裂过程中发生的染色体重组与交叉互换,导致在同一品种群体中品种的实际组成各不相同。因此,基于系谱的品种组成估计可能与实际组成大不相同。利用基因组数据来估计基因组品种组成(GBC),能够在基因组水平上衡量父母的实际贡献,并有助于纠正谱系错误,这种方法比使用谱系记录更有效。GBC的祖先和品种起源基本上是用微卫星标记、单核苷酸多态性(SNP)和序列数据估计的。
目前分析GBC的方法都使用遗传数据分析不同的种群:包括基于模型的聚类方法,如STRUCTURE和ADMIXTURE,以及主成分分析(PCA)。大多数基于模型的聚类方法对多个个体的祖先进行无监督分析,并一同估计祖先群体的等位基因频率。除此之外,ADMIXTURE的监督分析对于准确估计已知祖先历史个体的ADMIXTURE分数是很有价值的,其采用适当的线性回归方法(最小二乘法)估计SNP基因型的品种组成。
但是,由于同一水产动物的不同品种在进化上的同源性(来源于同一祖先),使得不同品种水产动物的基因序列具有一定的相似度,因此在用现有的ADMIXTURE模型估计水产动物品种组成时,模型会对这些相似的基因序列产生一些小的分量,换言之,并不是所有纯种动物都有100%的GBC,如果按照100%的GBC作为判断纯种扇贝的标准,那么这些小分量的存在会导致鉴定结果具有很高的假阴性,若直接使用较低的估计值作为判断标准,就会大大降低估计结果的准确性。
发明内容
本发明提出了一种基于ADMIXTURE-MCP模型估计水产动物基因组品种组成的新方法。针对以往的ADMIXTURE模型对不同种扇贝的相似基因序列产生小分量的问题,本发明使用稀疏优化方法产生稀疏解来降低传统模型由基因相似性而产生的估计GBC噪音。我们发现传统L1范数约束模型产生的稀疏解不稳定,虽然可以减少ADMIXTURE小分量的问题,但估计GBC组成与真实GBC组成往往会发较大偏离。为了克服传统算法使用L1范数约束导致严重GBC估计偏差的缺陷,本发明提出使用非凸函数MCP约束来替代L1范数约束,其能够在减少GBC噪声同时,更能产生更接近无偏估计GBC结果。
本发明提供一种基于ADMIXTURE-MCP模型估计水产动物基因组品种组成的新方法,所述方法包括步骤:
1)获得某一水产动物未知品种的基因组SNP标记数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国海洋大学,未经中国海洋大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010189230.2/2.html,转载请声明来源钻瓜专利网。