[发明专利]新基因组测序策略无效
申请号: | 201080004824.6 | 申请日: | 2010-01-13 |
公开(公告)号: | CN102272334A | 公开(公告)日: | 2011-12-07 |
发明(设计)人: | M·J·T·范艾杰克;A·J·范托恩;A·A·A·W·扬森 | 申请(专利权)人: | 关键基因股份有限公司 |
主分类号: | C12Q1/68 | 分类号: | C12Q1/68 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陶家蓉 |
地址: | 荷兰瓦*** | 国省代码: | 荷兰;NL |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 策略 | ||
技术领域
本发明涉及从头全基因组测序的有效方法。本发明涉及大规模核酸测序,特别是对生物的基因组或或其中一部分测序的方法。本发明涉及基于高通量测序技术测定优选复杂(即大)基因组的序列的改良策略。
背景技术
许多测序设计的目的是首次测定目标生物的完整基因组(从头基因组草图测序)。拥有基因组序列草图能鉴定生物的有用遗传信息,例如鉴定异种或同种不同个体之间基因改变的起源。因此,本领域对于能够以合理成本和精力从头测定个体(无论是人、动物或植物)完整基因组序列的技术有广泛的需求。这个目标通常表现为1000$-基因组,即最高耗费1000$来测定个体完整基因组序列(不考虑货币波动)。然而,实践中1000$基因组并不必定依赖于从头基因组测序和组装策略,也可基于重测序法。后一种情况下,重测序的基因组并不从头组装,但其测序得到的DNA与现存的感兴趣生物的参考基因组序列比较(或作图)。因此,重测序法技术上挑战较小,花费较少。为了清楚起见,本发明集中于从头基因组测序策略,其能用于缺乏参考基因组序列的生物。
目前的尝试各种各样,获得了多种多样和迅速增加的结果。但是,目标还未实现。以直截了当的方式对完整基因组测序和组装仍然在经济上并不可行。本领域仍然存在对于改良从头基因组测序策略的需要。
WO03/027311描述了一种克隆阵聚集鸟枪测序法(CAPPS)。该方法使用来自不同(BAC)克隆池的随机序列读数。基于该随机读数的交叉组装,可从多个克隆产生序列重叠群,并可产生相对于序列的克隆的图。该出版物更详细描述了在多维收集池,例如两维形式中BAC文库的产生,该两维形式是每个池和列含有148个BAC克隆(148x148形式)。使用CAPPS,以平均4-5X覆盖率对BAC池进行测序,在两维合并聚集方案中产生每BAC 8-10X覆盖率。在两维聚集方案中,基于在单独一列和单独池中出现的对BAC独特的序列,对每个BAC分别产生重叠群。然后,将这些BAC组装成基因组的重叠群。出版物仅基于5个BAC演示了该技术。该出版物未提及数据加工的问题。然而该技术的缺点之一是,使用随机剪切的片段需要大量读数,来以8-10倍的序列冗余水平覆盖基因组,使得该方法在大规模下非常耗力。另外,其不产生基于序列的物理BAC图。
US2007/0082358描述了一种从头组装序列信息的方法,该方法基于克隆分离和扩增的单链基因组DNA文库,使用产生有序限制性图的限制性酶,结合全基因组光学限制性作图产生完整基因组鸟枪序列信息。
US2002/0182630公开了一种通过比较亚序列的BAC重叠群作图法。该方法旨在避免与重复序列有关的困难,以及通过在重复富集的区域产生桥来生成重叠群。
以BAC为基础测定物理图谱可基于BAC文库测序(基于序列的BAC克隆物理图谱),使用例如Keygene在WO2008/007951中描述的方法(也称作“全基因组作图”或WGP)。简单说,WGP涉及产生至少一部分基因组的物理图谱,包括步骤:从样品DNA产生人工染色体文库,聚集克隆,用限制性酶消化聚集的克隆,连接含标识物的接头,扩增连接有含标识物的接头的限制性片段,将克隆的扩增子与克隆相联并排序片段,以产生重叠群,从而建立物理图谱。
虽然在高通量测序中有许多发展,高精确测定基因组序列草图仍然被认为是昂贵和耗时的。现有方法仍需要补充,以形成产生基因组序列草图的有效且经济的方法。?特别是,目前的高通量测序技术提供了相对较短读数(直到400nt),产生的较短重叠群难以组装成更大重叠群,并对计算能力提出高要求。
发明概述
本发明人发现,将基于克隆的基因组作图与使用高通量测序技术的样品(基因组)DNA的(高通量)测序结合起来,为高效迅速测定基因组序列草图提供了卓越的策略。通过从测序读数产生重叠群,并将这些读数锚定在全基因组作图所得的BAC(或YAC或任何其它大插入克隆载体)-重叠群中,产生长度和密度都有所提高的重叠群。因此,获得了一种基因组序列草图,其通过较少的重叠群生成,从而提高了其质量。
定义
群聚:术语“群聚”意味着在相同或相似核苷酸的短或长区段的存在下,比较两个或多个核苷酸序列,并基于相同或类似序列的短(或长)区段将具有某最小水平序列同源性的序列集合在一起。
比对:将多个序列以表格形式放置,以尽可能,例如通过引入缺口获得比对中不同序列之间的相同序列区域。本领域中已知几种核苷酸序列的比对方法,在下文中进一步详述。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于关键基因股份有限公司,未经关键基因股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201080004824.6/2.html,转载请声明来源钻瓜专利网。