[发明专利]一种绵羊全基因组重测序分析方法在审
申请号: | 201910448101.8 | 申请日: | 2019-05-27 |
公开(公告)号: | CN110189796A | 公开(公告)日: | 2019-08-30 |
发明(设计)人: | 依明·苏来曼;阿布来提·苏来曼;决肯·阿尼瓦什;刘武军;黄锡霞;黄李勇;赵雄 | 申请(专利权)人: | 新疆农业大学 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/00 |
代理公司: | 北京方圆嘉禾知识产权代理有限公司 11385 | 代理人: | 董芙蓉 |
地址: | 830052 新疆维吾尔自治区乌鲁*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 绵羊 比对 全基因组 文库 测序分析 测序数据 目标分析 数据信息 序列数据 测序 质检 质控 检测 染色体结构变异 测序序列 单核苷酸 基因技术 缺失变异 数据过滤 基因组 小片段 制备 参考 评估 | ||
本发明公开了一种绵羊全基因组重测序分析方法,涉及基因技术领域。本发明方法包括以下步骤:(1)获取绵羊DNA,检测其纯度、浓度及体积,对检测合格后的样品进行文库制备和文库质检,对质检合格的文库进行测序,获得绵羊原始测序数据;(2)对所述绵羊原始测序数据进行数据过滤并评估测序质量,经数据质控合格后获得目标分析序列数据;(3)将所述目标分析序列数据比对到绵羊参考基因组上,经比对指标质控合格后获得比对上的数据;(4)检测所述比对上的数据的单核苷酸SNP变异、小片段插入缺失变异InDel及染色体结构变异SV,并进行注释,获得绵羊全基因组测序序列中的SNP数据信息、InDel数据信息和SV数据信息。
技术领域
本发明涉及基因技术领域,尤其涉及一种绵羊全基因组重测序分析方法。
背景技术
DNA是生物体内一类重要的物质,它以基因的形式荷载遗传信息,并作为基因复制和转录的模板,它在细胞的生长分化和生物个体的发育、代谢及疾病发生等过程中发挥重要作用。细胞所携带的全部遗传信息合称为基因组。
全基因组重测序,基于Illumina测序平台,对已有参考基因组序列的物种进行个体或群体的全基因组测序,利用高性能计算平台和生物信息学方法,检测单核苷酸多态性位点(SNP)、插入缺失(InDel)等多态性信息,获得其生物遗传特征,从而进行后续的遗传进化分析及重要性状有关的候选基因的预测,对该物种的分子育种等研究具有重要的指导意义。然而针对绵羊全基因组还未有更详细更具体的测序方法及其有效分析。
发明内容
有鉴于此,本发明实施例提供了一种绵羊全基因组重测序分析方法。
为达到上述目的,本发明主要提供了如下技术方案:
一方面,本发明实施例提供了一种绵羊全基因组重测序分析方法,所述方法包括步骤:
(1)获取绵羊DNA,检测所述DNA的纯度、浓度及体积,对检测合格后的样品进行文库制备和文库质检,对质检合格的文库进行测序,获得绵羊原始测序数据;
(2)对所述绵羊原始测序数据进行数据过滤并评估测序质量,经数据质控合格后获得目标分析序列数据;
(3)将所述目标分析序列数据比对到绵羊参考基因组上,经比对指标质控合格后获得比对上的数据;
(4)检测所述比对上的数据的单核苷酸SNP变异、小片段插入缺失变异InDel及染色体结构变异SV,并进行注释,获得绵羊全基因组测序序列中的SNP数据信息、InDel数据信息和SV数据信息。
作为优选,所述数据过滤的具体过程为:
(1)去除接头污染的序列;其中,序列中接头污染的碱基数大于5bp,对于双端测序,若一端受到接头污染,则去掉两端的序列;
(2)去除低质量的序列;其中,序列中质量值Q≤19的碱基占总碱基的50%以上,对于双端测序,若一端为低质量序列,则会去掉两端的序列;
(3)去除含N比例大于5%的Reads;其中,对于双端测序,若一端含N比例大于5%,则会去掉两端的序列。
作为优选,所述评估测序质量包括评估数据的质量分布信息和数据的碱基分布信息;其中,所述质量分布信息包括统计碱基测序错误率和碱基正确识别率。
作为优选,将所述目标分析序列数据比对到绵羊参考基因组上采用软件BWA;比对率为90.2%-99.1%。
作为优选,所述比对指标质控包括测序深度分布信息;其中,所述测序深度分布信息包括单碱基深度分布信息和累积深度分布信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新疆农业大学,未经新疆农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910448101.8/2.html,转载请声明来源钻瓜专利网。