[发明专利]一种检测拷贝数变化的方法有效
申请号: | 202110770842.5 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113249453B | 公开(公告)日: | 2021-09-24 |
发明(设计)人: | 李珉;姜玥;梁萌萌 | 申请(专利权)人: | 苏州赛美科基因科技有限公司 |
主分类号: | C12Q1/6858 | 分类号: | C12Q1/6858;G16B20/20 |
代理公司: | 北京同辉知识产权代理事务所(普通合伙) 11357 | 代理人: | 刘洪勋 |
地址: | 215100 江苏省苏州市相城区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 拷贝 变化 方法 | ||
本发明公开了一种检测拷贝数变化的方法,包括以下步骤:样本基于2X设计的多重PCR建库测序,获得带UMI标签的样本测序数据,进行质控后,再与参考基因组进行比对,获得比对数据;样本包括测试样本和对照样本;计算样本测序数据中的每个扩增子的测序序列数目,得到矩阵文件,矩阵文件中每列代表一个样本,每行代表一个扩增子的测序序列数目;对矩阵文件进行校正;校正后的矩阵文件,将矩阵文件每行取平均数或中位数,用测试样本的某个扩增子所在行的平均数或中位数,除以对照样本对应于测试样本的某个扩增子所在行的平均数或中位数,得到比值;根据比值结果判断目标区域CNV情况。该方法降低了数据噪音,提高了CNV检测的准确性。
技术领域
本发明涉及生物信息学与精准医学全基因组变异检测技术领域,具体涉及一种基于2X设计多重PCR高通量测序的检测拷贝数变化的方法。
背景技术
拷贝数变异(copy number variation,CNV)是一种与基因功能和人类疾病发生密切相关的遗传突变,因此CNV的研究目前在新生儿遗传性疾病检测、遗传疾病的诊断和某些常见病的辅助诊断方面应用较为广泛。对于某些疾病,只关注特定基因即可达到同样效果。靶向测序技术可以将感兴趣的基因组区域富集出来测序,单个样本测序数据产出少且分析速度较快,因此更能经济高效地发挥NGS技术的优势,广泛应用到临床检测、健康筛查等众多领域。另外,靶向测序可以对目标区域进行深度测序,增加了目标区域内遗传变异检测的灵敏度和准确性。
靶向测序的方法主要分为两种:杂交捕获测序和多重扩增子测序。多重PCR(multiplex PCR),又称多重引物PCR或复合PCR,多重扩增子测序即针对感兴趣的目标区域,设计多重PCR引物进行扩增富集并进行测序的技术。通常适用于检测几十到几千个位点,或几十kb以下的区域。杂交捕获测序,目前应用的主要是液相杂交捕获测序,即基于碱基互补配对原理,设计合成核酸探针,对DNA文库进行基于液相环境的目标区域杂交富集,并进行测序。但液相杂交捕获操作难度较高、操作时间较长、且容易受到探针捕获效率的影响,因此扩增子测序相比来说,更适合非专业技术人员操作。多重PCR作为一种快速构建靶向测序文库的方法,由于其高效性、系统性和经济简便性在目前的临床基因检测及研究领域中发挥越来越大的作用。
多重PCR目前的技术局限性包括等位基因脱扣(Allele drop-out, ADO),即杂合子的2个等位基因中的1个优势扩增,而另1个完全扩增失败。为解决ADO问题,有文献提供2X设计的解决方法(如图1所示),即在目标区域设计两对引物扩增,即使其中一对引物受到ADO影响,另一对引物还可以将正常等位信息扩增出来。该方案虽然可以避免检测点突变时的漏检误检,但对于拷贝数检测还是会造成影响,当其中一对引物受到ADO影响,基于测序深度(read depth) 或序列数目(read count) 算法检测CNV时会有一定数据波动,引入噪音,造成检测假阳性。
发明内容
本发明的目的在于,提供一种检测结果稳定、准确的检测拷贝数变化的方法。
本发明检测拷贝数变化的方法,是基于2X设计的多重PCR扩增体系,利用带分子标签(Unique Molecular Identifiers, UMI)的高通量测序数据,对每对引物的扩增效率进行评估,并对测试样本扩增子CNV进行检测。
UMI(unique molecular identifiers)是一种分子条形码,可以在测序过程中错误校正,提高准确性。这些分子条形码均为短序列,可特异性地标记样本文库中的每个分子,UMI测序可以降低假阳性变异检出的概率,同时能提高变异检测的灵敏度。由于起始材料中的每个核酸都有唯一的分子条形码,因此,生物信息学软件可以高度精确地过滤出重复的read和PCR错误,报告唯一read,从而在最终数据分析之前消除已识别的错误。UMI是一段随机化或特定的核苷酸短序列,在建库的过程中通过连接的方式导入,从而如同分子条形码一般特异性地标识每个模板,用以在高通量测序的海量数据中区分同一来源的DNA片段。
UMI碱基,即由碱基短序列组成的分子条形码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州赛美科基因科技有限公司,未经苏州赛美科基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110770842.5/2.html,转载请声明来源钻瓜专利网。