[发明专利]皮克量DNA的全基因组测序方法在审
申请号: | 202080096056.5 | 申请日: | 2020-12-09 |
公开(公告)号: | CN115485389A | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | A·A·阿赫麦德;M·克拉米内贾德兰杰帕 | 申请(专利权)人: | 牛津大学创新有限公司 |
主分类号: | C12Q1/6806 | 分类号: | C12Q1/6806 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘文娜;刘芳 |
地址: | 英国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 皮克量 dna 基因组 方法 | ||
本发明涉及单细胞或细胞群的全基因组测序方法,用于识别单细胞或细胞群基因组中的单核苷酸变体、确定单细胞或细胞群基因组中的染色体结构变异或确定单细胞或细胞群基因组中的定相信息。还描述了用于核酸分子测序的索引的DNA文库的制备方法;用于单细胞或细胞群的全基因组测序的索引的DNA文库的制备方法,用于识别单细胞或细胞群的基因组中的单核苷酸变体、确定单细胞或细胞群的基因组中的染色体结构变异或确定单细胞或细胞群的基因组中的定相信息;以及单个细胞或细胞群的全基因组测序的方法,提供用于识别单细胞或细胞群基因组中的单核苷酸变体(SNV)、确定单细胞或细胞群的基因组中的染色体结构变异或确定单细胞或细胞群的基因组中的定相信息的数据。
本发明涉及制备用于测序的索引DNA文库的方法,例如用于识别单核苷酸变体(SNV)、确定染色体结构变异或确定单细胞或细胞群(cell-group)的基因组中的定相(phasing)信息的单细胞或细胞群的全基因组测序。
下一代测序彻底改变了我们对人类细胞在健康和疾病中的遗传进化的理解。在大批量癌症基因组测序中,推断变体的流行率,即含有变体的细胞的比例,可以计算肿瘤的克隆组成。反过来,对克隆组成的了解可以构建进化树,以讲述特定肿瘤如何随时间进化的故事(1-3)。分析单个克隆内的共有突变可用于推断可能在肿瘤进化过程中已经起作用的突变过程。理解肿瘤内发生了哪些突变过程以及是什么机制驱动它们是非常可取的,因为这可以为治疗性干预或预测肿瘤的进化轨迹提供机会。然而,测序深度的限制意味着使用标准的大批量全基因组测序(WGS)方法(图1A和图4)只能检测到在肿瘤发生早期出现的非常普遍的突变。因此,对进化事件建模的能力仅限于在肿瘤进化过程中已经确定的早期事件,而不是最近或当前的过程(1,4)。这限制了理解突变过程的实际应用。研究当前或最近的进化事件需要确信的识别出流行率非常低的突变(1,4)。
对单细胞或小群体的空间相关细胞的测序提供了通过检测细胞特异性或克隆特异性突变来解决这个问题的希望(图4)。这给出了当前观察到的细胞中发生的突变过程的读数(图1A)。然而,可以从单细胞或空间相关细胞获得的少(皮克)量DNA的精确测序是非常具有挑战性的。当处理少量DNA时,通过氧化或自发的脱氨基而不可避免的DNA损伤尤其麻烦(5)。这些损伤源分别导致不成比例的人工CA和CT突变数量(5-7)。在变体识别(variant calling)期间将这些人工突变识别为变体导致大量假阳性(FP)变体检出(call)。因此,全基因组扩增会在单核苷酸变体(SNV)识别中引发严重错误,从而妨碍准确估计突变负荷(6)。一个重要的问题是,此类突变也可归因于生物学过程,例如随着年龄的增长氧化DNA损伤的积累或APOBEC脱氨酶家族成员的过度活跃(8-10)。
以前无法区分当处理皮克量DNA时生物学驱动的CA和CT突变和在文库制备过程中出现的人工突变。此外,测序前通常的全基因组扩增(WGA)步骤会增加人工突变的数量并放大由DNA损伤引起的误差(5)。已经提出了几种方法来减少文库制备过程中的DNA损伤或过滤掉在分析过程中的假阳性结果(5,11-13)。然而,迄今为止,此类技术仍会导致数千个假阳性突变的保留,因此,在得出确切的生物学结论之前需要进行广泛的验证(5,11,12)。由于在大多数情况下无法进行广泛验证(5),因此需要一种可靠的方法来消除全基因组扩增测序数据中的假阳性变体。
Complete Genomics公司先前发表了一种用于10到20个人类细胞的全基因组测序和的单倍型分析的长片段读取(LFR)方法(Peters BA,et al.Accurate whole-genomesequencing and haplotyping from 10to 20human cells.Nature.2012Jul 11;487(7406):190-5.doi:10.1038/nature11236.PubMed PMID:22785314;PubMed CentralPMCID:PMC3397394)。然而,这种方法非常复杂,容易因索引交叉污染而产生偏差,并产生大量假阳性。
因此,本发明的目的是提供一种改进的方法以制备用于测序、SNV分析、确定染色体结构变异或确定定相信息的DNA文库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于牛津大学创新有限公司,未经牛津大学创新有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080096056.5/2.html,转载请声明来源钻瓜专利网。