[发明专利]从PCR后的独特分子标识符频率估算PCR前的片段数在审

申请号：	201880061221.6	申请日：	2018-09-21
公开（公告）号：	CN111108566A	公开（公告）日：	2020-05-05
发明（设计）人：	A·特克;M·莫尔达施勒	申请（专利权）人：	莱克斯奥根有限公司
主分类号：	G16B40/00	分类号：	G16B40/00;C12Q1/6851
代理公司：	北京市正见永申律师事务所 11497	代理人：	黄小临;闵丹
地址：	奥地利***	国省代码：	暂无信息
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	pcr 独特分子标识符频率估算片段
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明涉及一种估计扩增后核酸拷贝数的方法以及适用于执行此类方法的计算机程序产品，所述方法包括以下步骤：提供样品，该样品包含待确定拷贝数的核酸；将不同标签附着至所述核酸；通过核酸复制程序(优选PCR)扩增所述带标签的核酸；确定扩增的带标签核酸拷贝的量，对于带不同标签的核酸拷贝确定它们各自的量；基于确定的扩增的核酸拷贝的量，估计样品中的核酸拷贝数。

本发明涉及校正核酸偏倚量确定方法的领域，其中所述偏倚是由扩增方法引入的。

发明背景

聚合酶链反应(PCR)通过进行多个由变性、退火和聚合组成的循环来扩增核酸。由于每个步骤的效率取决于进入该步骤的序列，因此PCR扩增可引入序列特异性偏倚，这意味着具有不同序列的不同核酸将以不同比例扩增。例如，对于RNA-Seq(RNA测序，特别是片段测序或鸟枪测序)，这可导致不准确的基因和异构体定量分析(图1)。

WO 2017/051387 A1涉及一种使用码字(codeword)并通过观察码字熵(codewordentropy)来确定核酸样品的复杂度的方法。

已有人开发出了标签，例如独特分子标识符(UMI)，也称分子条形码，以识别PCR复制物并减少序列特异性PCR偏倚的影响。UMI是寡核苷酸，它们在每个位置上具有主要是随机的核苷酸分布，这些寡核苷酸与DNA片段连接后再进入PCR扩增。如果UMI均匀分布并且其数量比相同片段库大得多，则不太可能有相同的UMI连接到库中两种不同片段上。在这种情况下，PCR之后库中不同UMI的数量与PCR之前其片段的数量相同。因此，可以通过计数不同的UMI数量而不是PCR之后每个库中的片段数量来校正不同库的PCR效率波动(图2)。但是，如果UMI分布不均，例如由于连接偏倚或UMI生成中核苷酸的插入不均或UMI寡核苷酸内各处分布不均，这种简单的计数程序就变得不准确。UMI分布不均匀与UMI集大小不足具有相同的效果。在这两种情况下，相同的UMI很可能与两种片段连接，从而导致低估了PCR前的片段拷贝数(图3)。

因此，需要改进的方法，能够基于扩增后的测量数来估计核酸的量和校正这种扩增偏倚。

发明概述

本发明提供了(用扩增后估值)评估样品中核酸拷贝数的方法，包括以下步骤：

a)提供包含待确定拷贝数的核酸的样品；

b)将变量标签(variable labels)附着于这些核酸；

c)通过核酸复制程序扩增所述带标签的核酸；

d)确定扩增的带标签核酸拷贝的量，对于带不同标签的核酸拷贝，确定它们各自的量；和

e)基于步骤d)确定的量评估步骤a)的样品中的核酸拷贝数，方法是

针对样品中至少两种、优选至少四种、至少十种以上的不同种类核酸，使标签对每种核酸的附着概率近似化：对扩增后不同种类核酸的这样一种标签的量求平均值；和反复地或逐步地

(A)

优化基于步骤d)中不同标签的测得数量预期的样品中核酸拷贝数，以及根据标签附着至一种核酸拷贝的概率预期的附着至一种核酸的不同标签的数量，以及样品中核酸拷贝的预期数量或估计扩增效率的先前迭代或预设值；

或