[发明专利]一种校正高通量测序数据的方法和装置有效
申请号: | 201910194839.6 | 申请日: | 2019-03-14 |
公开(公告)号: | CN109920480B | 公开(公告)日: | 2020-02-21 |
发明(设计)人: | 周衍庆;陈亚如;尤沁;徐云 | 申请(专利权)人: | 深圳市海普洛斯生物科技有限公司 |
主分类号: | G16B20/00 | 分类号: | G16B20/00;G16B30/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 李小焦 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 校正 通量 序数 方法 装置 | ||
本申请公开了一种校正高通量测序数据的方法和装置。本申请的方法包括,将测序获得的read pair或read数据与参考基因组比对;将相同起点和终点位置的read pair或read分成一个Ai子集;比较每个子集中的read pair或read在基因组比对位置上的每一个碱基序列,根据预设的突变阈值去除重复和假阳性突变位点;最后输出高覆盖率的一致性数据,每一个子集只保留修正过的单一read pair或read。本申请的方法,能去除高通量测序中建库、杂交捕获和PCR产生的大量重复和假阳性突变,适用于去除癌症组织突变检测和液体活检等易产生假阳性突变的高深度测序,为提高检测质量和效率奠定了基础。
技术领域
本申请涉及高通量测序数据校正领域,特别是涉及一种校正高通量测序数据的方法和装置。
背景技术
随着二代测序技术的发展,高深度测序在肿瘤突变检测、液体活检领域应用越来越广泛。尤其是以外周血游离DNA(缩写cfDNA)为主的突变检测成为癌症早期筛查和癌症临床治疗的重要辅助手段。虽然,随着肿瘤进展,癌症患者的外周血游离肿瘤DNA(缩写ctDNA)含量明显升高,但是大部分患者ctDNA含量的比例在0.5-5%之间,加之高通量测序在建库实验和测序过程中会引入大量的错误,导致目前检测肿瘤来源的体细胞突变难度依旧极大。
目前能够进行ctDNA检测的方法包括基于聚合酶链式(缩写PCR)反应的BEAMing方法和微滴式数字PCR(缩写ddPCR),以及高深度测序和通过加入UMI(即unique molecularidentifier单分子编码)提高准确性和敏感性的深度测序技术。
其中,高深度测序和UMI深度测序技术都是依赖于高通量测序进行ctDNA检测;特别是通过给每个原始的DNA模板加入特殊的分子标签序列进行高通量测序,能够提高后续数据分析的准确性,加强基因检测在临床实践的指导作用。
但是,如前面提到的,ctDNA含量较低,需要采用PCR扩增富集建库,这个过程中会引入大量的PCR重复和假阳性,影响检测结果的准确性和重复性。因此,目前亟需一种对高深度测序或添加了分子标签的高深度测序结果进行校正的方法,以去除突变检测中PCR重复和建库实验过程中引入的假阳性。
发明内容
本申请的目的是提供一种新的校正高通量测序数据的方法和装置。
为了实现上述目的,本申请采用了以下技术方案:
本申请的一方面公开了一种校正高通量测序数据的方法,包括以下步骤,
数据读取和比对步骤,包括读取高通量测序数据,将测序获得的read pair或read数据与参考基因组比对;
相同起点和终点位置子集构建步骤,包括根据比对结果将具有相同起点和终点位置的readpair或read分成一个子集,标记为Ai子集,i为子集的编号;
过滤步骤,包括比较每个子集中的readpair或read在基因组比对位置上的每一个碱基序列,再根据预设的突变阈值去除重复和假阳性突变位点;
输出步骤,包括输出高覆盖率的一致性数据,每一个子集只保留修正过的单一readpair或read,即获得校正后的测序数据。
需要说明的是,本申请的关键在于将测序数据分成若干子集,并分别对子集进行过滤,去除重复和假阳性突变位点,使得最终输出的测序数据具有覆盖率高、一致性好等优点。通过本申请的方法,去除了大量的PCR重复和假阳性,提高了高通量测序检测的准确性和重复性。可以理解,本申请的方法尤其适用于去除癌症组织突变检测和液体活检等易产生假阳性突变的高深度测序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市海普洛斯生物科技有限公司,未经深圳市海普洛斯生物科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910194839.6/2.html,转载请声明来源钻瓜专利网。