[发明专利]一种使用duplex方法检测ctDNA低频突变的文库构建和测序数据的分析方法在审
申请号: | 201810585283.9 | 申请日: | 2018-06-08 |
公开(公告)号: | CN108728515A | 公开(公告)日: | 2018-11-02 |
发明(设计)人: | 王沛;马兴勇;谭达;杨洁;李光宇;阎海;王思振;王晓月;焦宇辰 | 申请(专利权)人: | 北京泛生子基因科技有限公司 |
主分类号: | C12Q1/6806 | 分类号: | C12Q1/6806;C12Q1/6827;C12Q1/6869;C40B50/06;G06F19/22 |
代理公司: | 北京纪凯知识产权代理有限公司 11245 | 代理人: | 关畅;秦梦楠 |
地址: | 102206 北京市昌平区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 测序数据 突变 检测 文库构建 文库 生物信息分析 检测灵敏度 接头混合物 标记分子 连接效率 末端修复 序列组合 假阳性 测序 构建 去除 捕获 样本 标签 分析 合成 引入 | ||
1.一种构建用于检测ctDNA低频突变的文库的方法,依次包括如下步骤:
(1)将ctDNA样本依次进行末端修复和3’端加A处理;
(2)将步骤(1)处理后的ctDNA与接头混合物连接,经过PCR扩增后得到文库;
所述接头混合物由n个接头组成;
每个接头均由一条上游引物甲和一条下游引物甲形成部分双链结构得到;
上游引物甲中具有barcode标签甲;下游引物甲中具有barcode标签乙;
barcode标签甲和barcode标签乙反向互补;
barcode标签甲由A、T、C和G组成,排列顺序任意;
n个接头采用n个不同的barcode标签甲;
n为≥8的任意自然数。
2.如权利要求1所述的方法,其特征在于:上游引物甲的3’末端的第一个核苷酸为具有修饰的T;所述修饰的目的为防止核酸外切酶降解;下游引物甲的5’末端进行磷酸化修饰。
3.如权利要求1或2所述的方法,其特征在于:n=12。
4.如权利要求3所述的方法,其特征在于:
12个接头的barcode标签甲分别如序列表的序列1自5’端第22至25位、序列3自5’端第22至25位、序列5自5’端第22至25位、序列7自5’端第22至25位、序列9自5’端第22至25位、序列11自5’端第22至25位、序列13自5’端第22至25位、序列15自5’端第22至25位、序列17自5’端第22至25位、序列19自5’端第22至25位、序列21自5’端第22至25位和序列23自5’端第22至25位所示。
5.如权利要求3或4所述的方法,其特征在于:
所述12个接头如下:
接头1由序列表的序列1所示的单链DNA分子和序列2所示的单链DNA分子形成部分双链结构得到;接头2由序列表的序列3所示的单链DNA分子和序列4所示的单链DNA分子形成部分双链结构得到;接头3由序列表的序列5所示的单链DNA分子和序列6所示的单链DNA分子形成部分双链结构得到;接头4由序列表的序列7所示的单链DNA分子和序列8所示的单链DNA分子形成部分双链结构得到;接头5由序列表的序列9所示的单链DNA分子和序列10所示的单链DNA分子形成部分双链结构得到;接头6由序列表的序列11所示的单链DNA分子和序列12所示的单链DNA分子形成部分双链结构得到;接头7由序列表的序列13所示的单链DNA分子和序列14所示的单链DNA分子形成部分双链结构得到;接头8由序列表的序列15所示的单链DNA分子和序列16所示的单链DNA分子形成部分双链结构得到;接头9由序列表的序列17所示的单链DNA分子和序列18所示的单链DNA分子形成部分双链结构得到;接头10由序列表的序列19所示的单链DNA分子和序列20所示的单链DNA分子形成部分双链结构得到;接头11由序列表的序列21所示的单链DNA分子和序列22所示的单链DNA分子形成部分双链结构得到;接头12由序列表的序列23所示的单链DNA分子和序列24所示的单链DNA分子形成部分双链结构得到。
6.权利要求1-5任一所述的方法制备得到的文库。
7.权利要求1-5任一所述的方法或权利要求6所述文库在检测ctDNA样本中目标突变及其突变频率中的应用。
8.一种用于构建ctDNA低频突变检测文库的试剂盒,包括权利要求1-5中任一所述的接头混合物。
9.一种检测ctDNA样本中目标突变及其突变频率的方法,包括如下步骤:
(1)按照权利要求1-5中任一所述的方法制备文库;
(2)测序所述文库,得到测序结果,根据测序结果分析ctDNA样本中目标突变及其突变频率。
10.如权利要求9所述的方法,其特征在于:所述测序结果的分析方法如下:
(a)将测序结果比对到人参考基因组hg19上;
(b)在基因组上具有相同起始和终止位置,以及具有相同barcode标签的一簇reads,来自于同一分子的同一条链;对同一簇的reads进行比较和计算,一簇reads中同一位置上一致性高于80%的序列是有效的,出现次数最多的碱基是正确的碱基,被保留下来;如果一致性低于80%,则该碱基是测序,PCR或者捕获错误造成的,标记为N,不进入后续的变异检测;
(c)在基因组上具有相同起始和终止位置,read1和read2 barcode标签反向的两簇reads,分别来自于同一分子的正负链,称为duplex,在基因组的同一位置上,duplex read一致的序列被认为是正确的,而不一致的序列是测序、PCR或者捕获错误造成的,标记为N,不进入后续的变异检测;
突变频率的计算方法为:在测序数据中,覆盖该位点的数据,支持突变的数据/(支持突变的数据+支持野生型的数据)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京泛生子基因科技有限公司,未经北京泛生子基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810585283.9/1.html,转载请声明来源钻瓜专利网。