[发明专利]基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置有效
申请号: | 202010567812.X | 申请日: | 2020-06-19 |
公开(公告)号: | CN111755068B | 公开(公告)日: | 2021-02-19 |
发明(设计)人: | 黄毅;杨玲;罗梓文;裴士美;易鑫;刘久成;吴玲清;李俊;刘青峰;林浩翔 | 申请(专利权)人: | 深圳吉因加医学检验实验室 |
主分类号: | G16B20/20 | 分类号: | G16B20/20;G16B20/30;G16B30/00 |
代理公司: | 深圳鼎合诚知识产权代理有限公司 44281 | 代理人: | 李小焦;郭燕 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 序数 识别 肿瘤 纯度 绝对 拷贝 方法 装置 | ||
本申请公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。本申请方法包括,将质控后的下机数据比对到参考基因组上,并进行变异检测和人群数据库注释,使用纯度预测软件对肿瘤和正常样本预处理好的数据进行试验,获得纯度和拷贝数信息模型;对于符合正常分布的模型,进一步筛选出高肿瘤细胞分数亚克隆区域探针支持数最多的模型,并结合BAF与allele1和allele2拷贝数的匹配率定义最优模型。本申请的方法,快速高效的校正了纯度检测软件的模型,能更准确的得到肿瘤的纯度和绝对拷贝数信息;保障准确性的同时,避免了人工校验的繁琐过程,节省了人工成本,为后续肿瘤基因组进化以及肿瘤内异质性研究奠定了基础。
技术领域
本申请涉及肿瘤研究技术领域,特别是涉及一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。
背景技术
估计肿瘤的纯度和倍性有利于肿瘤基因组进化和肿瘤内的异质性研究。肿瘤的发生伴随着大量的基因组变异,定义染色体拷贝数和等位基因比例是理解肿瘤基因组的结构和历史的基础。目前的基因组鉴定技术以基因组单位,即DNA质量,来测量肿瘤样本的体细胞变化,这种测量的意义取决于肿瘤的纯度和整体倍性。肿瘤纯度在一定程度上影响了DNA拷贝数变化(CNV)的计算,理想情况下,拷贝数应该以每个肿瘤细胞的拷贝数来衡量。使用基因芯片测量体细胞拷贝数改变(SCNAs)已成为拷贝数分析的标准方法。
随着DNA二代测序(NGS)在基因组学领域的广泛应用,直接从NGS数据获得CNV结果已经逐渐在科研和临床检测中使用。不论使用基因芯片还是NGS,CNV的计算都是来自于两种数据,log2Ratio和B-Allele Frequency(BAF)。其中,log2Ratio用于计算CNV片段,BAF则用于计算杂合体的缺失(Loss of heterozygosity,LOH)和等位基因的失衡(AllelicImbalance)。
预测绝对拷贝数难度源于以下三个方面:(1)肿瘤细胞几乎总是与未知比例的正常细胞混合;(2)肿瘤细胞的实际DNA含量,由于总数和结构的染色体异常而未知;(3)肿瘤细胞群由于持续的亚克隆进化而可能是异质性的。原则上,可以根据每个肿瘤细胞的DNA质量的细胞学测量或单细胞测序方法,通过重新排列相对数据来推断绝对拷贝数。然而,这样的方法并不适合在解读肿瘤基因组中大规模使用。
目前,可以提供肿瘤纯度预测的方法大多局限于SNParray所产生的数据。例如,ABSOLUTE等纯度估计软件可以从低覆盖度的全基因组测序数据样本中进行肿瘤纯度的预测,是目前评估肿瘤纯度最常用的方法之一;其方法利用了肿瘤样本的CNV信息来对肿瘤纯度进行估计;但由于肿瘤样本的复杂性,其方法同时需要结合SNV的信息进行肿瘤纯度的估计以达到更高的准确度,软件会自动根据已预先设计好的癌症核型、体细胞突变频率以及体细胞拷贝数改变进行打分并选择得分最高模型;但是,得分最高的不一定是最优模型,进而需要人工校验结果,增加了获取肿瘤样本纯度信息的复杂性。
因此,亟需研发一种更有效的准确识别肿瘤纯度和绝对拷贝数的方案,以满足临床和科研的使用需求。
发明内容
本申请的目的是提供一种新的基于测序数据识别肿瘤纯度和绝对拷贝数的方法及装置。
为了实现上述目的,本申请采用了以下技术方案:
本申请的第一方面公开了一种基于测序数据识别肿瘤纯度和绝对拷贝数的方法,包括以下步骤:
数据预处理步骤,包括对肿瘤和正常样本的下机数据进行质控,并将质控后的数据比对到参考基因组上,对成对的肿瘤和正常样本的比对文件进行变异位点检测,对变异检测位点进行人群数据库注释;
纯度和拷贝数鉴定步骤,包括将数据预处理步骤获得的数据作为纯度预测软件的输入文件,得到纯度和拷贝数信息模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳吉因加医学检验实验室,未经深圳吉因加医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010567812.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种组合模块开关
- 下一篇:一种粉煤灰氨氮物质提取测试装置及方法