[发明专利]一种高密度遗传图谱的构建方法有效
申请号: | 201710804279.2 | 申请日: | 2017-09-08 |
公开(公告)号: | CN107644150B | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 蔡庆乐;唐耀华;何荣军 | 申请(专利权)人: | 杭州和壹基因科技有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/20 |
代理公司: | 杭州中成专利事务所有限公司 33212 | 代理人: | 唐银益 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 高密度 遗传 图谱 构建 方法 | ||
本发明提供了一种高密度遗传图谱的构建方法,步骤是1)根据遗传分离群体高通量测序数据中得到的SNP标记,对标记进行基因型分型和过滤,再计算两两之间的重组率;2)利用步骤1)算得的重组率,采用分层聚类算法根据前述遗传分离群体的染色体数对SNP标记进行分组,得到与染色体数对应的连锁群;3)采用最小生成树算法对标记进行排序,对排序后的SNP标记进行补缺失和纠错处理,最后计算遗传距离得到遗传图谱。本发明针对不同的遗传分离群体高效、高准确率的构建遗传图谱,为后续的生物信息学分析和遗传学研究提供有力支持。
技术领域
本发明属于生物信息技术领域,更具体的说,它涉及一种高密度遗传图谱的构建方法。
背景技术
遗传图谱是指某一物种的染色体图谱,也称为连锁图谱,用于表示基因和/或遗传标记的相对位置。遗传标记种类繁多,随着生物信息学和测序技术的进步,单核苷酸的多态性(SNP)标记由于其数量大、多态性丰富而越来越受到大家的重视,这使得构建高密度遗传图谱成为可能,但同时带来了对图谱构建方法和分析效率的挑战。
目前针对F1群体(亲本杂交产生的子一代)的分析软件很少,常见的就JoinMap4.0、Onemap、GACD等,虽然可以分析,但效率均很低,且分析的遗传标记数量有限。针对这种现象,有必要开发一种高效、高准确率,可适用不同物种不同分离群体的高密度遗传图谱的构建方法。
发明内容
本发明的目的是解决以上提出的问题,提供一种基于遗传标记的高密度遗传图谱的构建方法,命名为SMRTmap。以高通量测序产生的SNP数据为基础,针对不同的遗传分离群体进行基因分型,得到高质量的SNP标记,进而利用SMRTmap构建高密度遗传图谱。本发明的方法可以针对不同的遗传分离群体高效、高准确率的构建遗传图谱,为后续的生物信息学分析和遗传学研究提供有力支持。
本发明是通过以下技术方案实现的:
本发明公开了一种高密度遗传图谱的构建方法,它包括以下步骤:
1)根据遗传分离群体高通量测序数据中得到的SNP标记,对标记进行基因型分型和过滤,再计算两两之间的重组率;
2)利用步骤1)算得的重组率,采用分层聚类算法根据前述遗传分离群体的染色体数对SNP标记进行分组,得到与染色体数对应的连锁群;
3)采用最小生成树算法(MST)对标记进行排序,对排序后的SNP标记进行补缺失和纠错处理,最后计算遗传距离得到遗传图谱。
作为优化,所述遗传分离群体为性状分离群体,包括FI、F2、RILd、BC1、DH、Hap中的一种或多种。
作为优化,所述步骤1)包括以下步骤:
1.1)根据亲本的基因型及子代的基因型对SNP标记进行基因型分型;例如亲本基因型为Aa×Aa,根据孟德尔分离定律,子代的基因型共有AA、Aa和aa三种情况;
1.2)使用卡方检验、缺失率对SNP标记进行过滤,得到高质量的SNP标记,具体方法:
1.2.1)使用卡方检验过滤SNP标记的方法:
统计子代中每一种基因型的样本个数,利用卡方检验判断子代各基因型包含的样本量是否符合孟德尔分离比,如果符合,则保留这一个SNP标记,如果不符合,则过滤该SNP标记;
1.2.2)基于缺失率过滤SNP标记的方法:
基于样本缺失率:统计所有样本中某一个SNP标记的缺失与否,如果缺失率(缺失率=缺失样本数/总样本)小于设定的阈值(默认为15%),则保留该SNP标记,反之则过滤该SNP标记;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州和壹基因科技有限公司,未经杭州和壹基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710804279.2/2.html,转载请声明来源钻瓜专利网。