[发明专利]一种用于高通量测序体细胞突变检测性能评估的数据集和方法在审
申请号: | 202010497671.9 | 申请日: | 2020-06-04 |
公开(公告)号: | CN111916152A | 公开(公告)日: | 2020-11-10 |
发明(设计)人: | 杜红丽;陈子曦 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G16B20/50 | 分类号: | G16B20/50 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 郭炜绵 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 通量 体细胞 突变 检测 性能 评估 数据 方法 | ||
本发明公开了一种用于高通量测序体细胞突变检测性能评估的数据集和方法,人类参考基因组hg19突变集,其染色体和位置、碱基突变信息如表2所示。上述突变集在评估体细胞突变检测方法的性能中的应用,包括以下步骤:将BAM文件抽样至不同的测序深度,将待测DNA样品和阳性对照的BAM文件合并,不同的待测DNA样品比例即代表不同的突变频率;使用软件对上述混合数据进行突变检测,获得检测结果后与人类参考基因组hg19突变集进行比对;精确率、召回率、F值得分越高,说明方法的准确性和真实性越高。本发明将突变真集用于评估突变检测方法的性能,获得了更适宜采用的测序深度和突变频率,有效提高了突变检测结果的真实性和准确性。
技术领域
本发明属于生物技术领域,具体涉及一种用于高通量测序体细胞突变检测性能评估的数据集和方法。
背景技术
癌症是威胁人类健康的主要疾病之一。由于癌症的异质性,相同疗法对同种癌症类型的不同个体的疗效可能存在很大差异。因此,目前还没有一种疗法可以普遍适用于所有癌症,更精确的疗法亟待开发。
近年来,癌症治疗手段特别是靶向治疗方面取得了巨大进步。目前大多数靶向疗法都基于检测基因突变,例如,酪氨酸激酶抑制剂阿法替尼(Afatinib)和厄洛替尼(Erlotinib)用于靶向非小细胞肺癌中表皮生长因子受体(EGFR)的突变;丝氨酸/苏氨酸激酶(BRAF)抑制剂索拉非尼(Sorafenib),靶向BRAF基因发生V600E突变的黑素瘤;聚ADP-核糖聚合酶(PARP)抑制剂奥拉帕尼(Olaparib)用于治疗具有BRCA基因突变的晚期卵巢癌。因此,研究基因组突变是揭示癌症发病机制并指导开发更具针对性的药物的重要手段之一。
全外显子组测序(WES)是检测基因组突变的有效方法。据报道,通过靶向捕获芯片和下一代测序(NGS),WES能覆盖95%的编码区和98%的编码区突变。WES成本相对较低,适用于大型队列研究,目前已有很多基于WES的队列研究报道。检测体细胞突变的结果可能受许多因素影响,例如测序深度、突变检测软件和突变亚克隆占比等。单细胞测序研究已经证实,同一个病人体内的肿瘤细胞可能同时存在多个亚克隆,每个亚克隆的遗传背景及其所占比例不同。此外,不同的病理突变亚克隆占比可导致不同的突变频率,从而可能对突变检出造成困难。
基于高通量测序的体细胞突变检测的性能对于揭示癌症发病机制、指导靶向药物开发和指导靶向用药等都至关重要。然而,目前基于高通量测序的体细胞突变的检测性能不尽如人意,对于同一份样品,很多商业机构给出的检测报告存在较大差异,其主要原因之一是目前缺少合适的数据集对体细胞突变检测的准确性进行评价。
发明内容
本发明的首要目的在于提供人类参考基因组hg19突变集(在本文中也称“突变真集”)。
本发明的另一目的在于提供人类参考基因组hg19突变集在评估高通量测序体细胞突变检测方法性能中的应用。
本发明的再一目的在于提供一种高通量测序体细胞突变检测方法。
本发明的目的通过下述技术方案实现:
人类参考基因组hg19突变集,其染色体和位置、碱基突变等具体信息见表2。
上述人类参考基因组hg19突变集的制作方法,包括以下步骤:
(1)取待测DNA样品和阳性对照样品,纯化后,将其打断为100-500bp的DNA片段,捕获其中的外显子,将Illumina接头连接至外显子片段的两端,扩增后,得到Illumina外显子组测序文库;
所述的阳性对照优选NA12878;
(2)得到的Illumina外显子组测序文库进行全外显子组测序;测序后,过滤低质量的reads并去除接头,使用BWA-MEM软件将测序结果与hg19参考基因组比对,将比对得到的SAM文件转换为BAM文件;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010497671.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于峰值响应增强的实例分割算法、计算设备
- 下一篇:一种二叶瓣瓣膜假体