[发明专利]一种高通量测序突变检测方法、设备、装置及可读存储介质在审
申请号: | 202110972081.1 | 申请日: | 2021-08-24 |
公开(公告)号: | CN113628683A | 公开(公告)日: | 2021-11-09 |
发明(设计)人: | 李超 | 申请(专利权)人: | 慧算医疗科技(上海)有限公司;慧算基因科技(上海)有限公司 |
主分类号: | G16B20/50 | 分类号: | G16B20/50;G16B40/30 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 严晨;许亦琳 |
地址: | 201203 上海市浦东新区中国*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 通量 突变 检测 方法 设备 装置 可读 存储 介质 | ||
本发明涉及生物技术领域,特别是涉及一种高通量测序突变检测方法、设备、装置及可读存储介质。本发明提供一种高通量测序突变检测方法,包括:获取基因样本中各候选突变位点的特征信息,所述特征信息来源于基因样本的高通量测序数据;将各候选突变位点进行层次聚类分析;获取各类候选突变位点的背景值pbg;获取各类候选突变位点的最低检测下限;确定各候选突变位点的检测阈值。本申请所提供的高通量测序突变检测方法,可以通过自适应优化的算法,针对每个样本特有的数据特点智能的设定分析的阈值,在保证阳性位点检出的前提下尽可能的去除噪音造成的假阳性,可以更加精准的从样本中检测突变,从而具有良好的产业化前景。
技术领域
本发明涉及生物技术领域,特别是涉及一种高通量测序突变检测方法、设备、装置及可读存储介质。
背景技术
通过高通量测序进行肿瘤的突变检测被广泛的应用于肿瘤的基础与临床研究中。但由于在样本制备、保存、实验和分析中会引入大量的非自然来源的干扰噪音,因此,突变检测的一个关键步骤是准确区分真实的突变和不同来源的噪音信号。
目前去除噪音的实验和数据分析手段主要有以下几类:
1、针对测序过程中随机产生的噪音信号,这种类型的噪音随机低频次出现,但是可以利用测序中产生的重复,结合分子标签(CN106834275A),虚拟分子标签(CN107944225B)等技术方式结合高深度测序来校正;
2、针对在实验过程中产生的可重复的非随机噪音,例如DNA提取、打断、捕获过程中引入的噪音,因为这种类型的噪音出现频次较高,符合一定的统计规律,因此可以利用大量阴性样本建立的背景库来建立背景校正模型来进行校正和区分(CN105574365B);
3、针对一些特定的突变类型来设定不同的分析阈值,不同类型的变异噪音背景值不同,分类进行阈值设定,例如分别为点突变和插入缺失突变设定不同的检测阈值,可以提高分析的准确性(CN108690871A)。
上文中提到的几种技术方案,分别解决了低频次随机噪音,高频次固有噪音和不同类型突变的固有噪音的问题,但是,实际中还存在的另一种噪音类型,非随机低频次的样本特异性噪音,有多种因素可能导致这种类型的噪音出现,例如,1、样本自身DNA的损伤,在常用的福尔马林固定的肿瘤样本中常有出现,此类样本会经常出现(CT|GA)类型的噪音变异;2、样本片段化长度不一致(过长或过短的片段)导致的噪音,因为每个样本的实验条件不同,导致无法通过理想的背景噪音模型来复现和消除;3、样本PCR扩增轮数、扩增酶保真率不同导致的PCR错误,每个样本因为初始量不同,PCR扩增轮数不同,而每次扩增引入错误的比例又与扩增酶实验所处状态相关,样本与样本间会存在差异。这些因素的共同特点都是样本本身特异,无法在样本间有效复现,但是样本内部非随机,在同一次实验中重复出现,因此无法通过前一部分提到的技术方案来去除,影响检测结果的准确性。
发明内容
鉴于以上所述现有技术的缺点,本发明的目的在于提供一种高通量测序突变检测方法,用于解决现有技术中的问题。
为实现上述目的及其他相关目的,本发明一方面提供一种高通量测序突变检测方法,包括:
S1)获取基因样本中各候选突变位点的特征信息,所述特征信息来源于基因样本的高通量测序数据;
S2)基于各候选突变位点的特征信息和目标值s,将各候选突变位点进行层次聚类分析,其中,目标值s由各候选突变位点与其所在的分类内部其他候选突变位点的距离d的平均值a和各候选突变位点与最近的一个分类中的候选突变位点的距离d的平均值b计算获得;
S3)根据层次聚类分析结果,基于候选突变位点的突变丰度,获取各类候选突变位点的背景值pbg;
S4)根据层次聚类分析结果,基于候选突变位点的深度及其所在的分类的背景值pbg,获取各类候选突变位点的最低检测下限;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于慧算医疗科技(上海)有限公司;慧算基因科技(上海)有限公司,未经慧算医疗科技(上海)有限公司;慧算基因科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110972081.1/2.html,转载请声明来源钻瓜专利网。