[发明专利]杂合基因组处理方法有效
申请号: | 201410137420.4 | 申请日: | 2014-04-04 |
公开(公告)号: | CN104164479B | 公开(公告)日: | 2017-09-19 |
发明(设计)人: | 詹东亮 | 申请(专利权)人: | 深圳华大基因科技服务有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68 |
代理公司: | 中国专利代理(香港)有限公司72001 | 代理人: | 易皎鹤,汤春龙 |
地址: | 518083 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 处理 方法 | ||
技术领域
本发明涉及基因工程技术领域和基因组生物信息学分析领域。特别地,本发明涉及杂合基因组处理,以获得物种的全基因组序列图谱。
背景技术
全基因组de novo测序也叫从头测序,不需要任何参考序列即可对某个物种进行测序,用生物信息学分析方法进行拼接、组装,从而获得该物种的全基因组序列图谱。获得一个物种的全基因组序列是加快对此物种了解的重要捷径。
随着人类基因组计划启动,世界迈出了基因组测序的重要一步;各种模式的动植物线虫、拟南芥、小鼠等纷纷进行了基因组测序;由于技术水平限制,基因组测序还处于初级阶段,在一些重要物种测序完成后,第一代基因组测序也慢慢走向成熟,伴随而来的是利用第一代测序技术对各种重要物种基因组的测序热潮,各种重要动植物基因组相继被测序。不论这些数字如何令人印象深刻,第一代测序技术在速度和成本方面都已达到了极限,因此,需要开发全新的技术来突破这些局限。另外,第一代测序技术也遇到了一个很大的瓶颈,那就是基因组杂合的问题。基因组杂合的情况广泛存在于具有重要经济或科研价值的物种中,而传统的杂合基因组图谱绘制方案成本高、周期长,严重制约了这些物种基因组的解读。
发明内容
本发明要解决的技术问题在于,针对现有技术中传统的杂合基因组图谱绘制方案成本高、周期长,严重制约了物种基因组的解读的缺陷,提供一种杂合基因组处理方法。
本发明解决其技术问题所采用的技术方案是:构造一种杂合基因组处理方法,其包括:
采用全基因组鸟枪法对目标物种进行至少200倍的超高深度测序,以获得有效的读长短序列Reads;
对所述有效的Reads执行组装和构建支架序列Scaffold,以获得带有冗余序列的基因组图谱;
对所述带有冗余序列的基因组图谱执行杂合识别处理,从而去除杂合区域中冗余的Scaffold并保留杂合区域信息以获得全基因组图谱。
在本发明的杂合基因组处理方法中,所述杂合识别处理包括基于k-mer分布图来识别所述杂合区域。
在本发明的杂合基因组处理方法中,所述基于k-mer分布图来识别所述杂合区域包括:
通过k-mer分布图,识别所述带有冗余序列的基因组图谱中的Unique k-mer区域,其中,所述Unique k-mer表示在基因组中只出现一次的k-mer,k-mer表示定长为指定值k的短序列,k为正整数;
根据所述Unique k-mer区域来确定所述杂合区域。
在本发明的杂合基因组处理方法中,所述根据所述Unique k-mer区域来确定所述杂合区域包括:
统计每条Scaffold上的Unique k-mer的数量N以及那些在已统计过的一条Scaffold上出现过的Unique k-mer的数量M,其中N和M均为正整数;
如果M/N的值达到预定值,则将这两条Scaffold确定为对应的杂合区域。
在本发明的杂合基因组处理方法中,至少基于组装的长度来去除杂合区域中冗余的Scaffold。
在本发明的杂合基因组处理方法中,在构建支架序列Scaffold之前,还包括构建重叠群序列Contig。
在本发明的杂合基因组处理方法中,还包括对所述全基因组图谱进行基因组注释和/或基因组进化分析。
在本发明的杂合基因组处理方法中,所述基因组注释包括Repeat注释、基因预测、基因功能注释和ncRNA注释;所述基因组进化分析包括基因家族鉴定、物种系统发育树构建、物种分歧时间估算、基因组共线性分析和全基因组复制分析。
在本发明的杂合基因组处理方法中,采用全基因组鸟枪法对目标物种进行至少200倍的超高深度测序,以获得有效的读长短序列Reads包括:
构建文库;
采用全基因组鸟枪法对所构建的文库进行至少200倍的超高深度测序,以获得原始的Reads;
对所述原始的Reads进行过滤,以获得有效的Reads。
在本发明的杂合基因组处理方法中,构建文库包括构建小片段文库和构建大片段文库,其中,小片段文库包括长度不同的多个插入片段文库,大片段文库包括长度不同的多个配对Mate Pair文库。
在本发明的杂合基因组处理方法中,构建小片段文库包括:
将检测合格的目标物种的DNA样品打断,以获得DNA片段;
对所述DNA片段进行末端修复;
将末端修复的DNA片段的3’端连接碱基A;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大基因科技服务有限公司,未经深圳华大基因科技服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410137420.4/2.html,转载请声明来源钻瓜专利网。