[发明专利]合成WGS生物信息学验证在审
申请号: | 201780041482.7 | 申请日: | 2017-06-30 |
公开(公告)号: | CN109791796A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 查尔斯·瓦斯克;拉胡尔·帕鲁勒卡尔;约翰·扎卡里·桑伯恩;斯蒂芬·本茨;马克·约翰逊 | 申请(专利权)人: | 南托米克斯有限责任公司 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B35/00;G06F16/901;G16C20/60;G16B50/00;G16B20/00 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 潘璐;刘继富 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 生物信息学 合成数据 合成 验证 变体 方法和设备 基因组分析 基因组数据 准确度 灵敏度 数据集 再现性 评估 调用 优选 匹配 变更 检测 改进 | ||
公开了用于生成合成基因组数据集和验证用于基因组分析的生物信息学管道的系统、方法和设备。在优选的实施方案中,具有已知变体的合成的母系和父系数据集与匹配的正常合成数据集一起使用以验证各种生物信息学管道。使用合成数据集评估生物信息学管道,以评估设计的变更和改进。报告了合成数据集中调用变体中管道的准确度、PPV、特异性、灵敏度、再现性和检测限。
本申请要求2016年6月30日提交的美国临时申请第62/357282号的优先权,其通过引用并入本发明。
技术领域
本发明的领域是用于检测遗传变异的验证系统和方法,特别是涉及全基因组数据的计算分析。
背景技术
背景描述包括可以用于理解本发明的信息。其并非承认此处提供的任何信息是现有技术或与要求保护的本发明相关,也不是承认任何具体或隐含引用的出版物都是现有技术。
本文中的所有出版物均以引用方式并入,其程度与每一项单独的出版物或专利申请被具体和单独地指明为以引用方式并入的程度相同。当并入的参考文献中术语的定义或用法与本文提供的术语的定义不一致或相反,则适用本文提供的术语的定义,而该术语在参考文献中的定义不适用。
随着全基因组测序(WGS)和下一代测序平台的出现,大量的数据现在可用于分析。虽然从临床角度来看,数据的价值无疑是令人期望的,但也出现了各种困难。例如,在大多数临床全基因组分析中,对肿瘤组织过度取样30至100倍,同时过度取样至少10至30倍的匹配的正常组织的情况并不少见,在这种情况下,大多数遗传信息是从大小为约100至400个碱基的片段中由测序机获得的。因此,需要显著的计算能力才能准确地重组基因组并识别基因组中的变化。
例如,最近的一篇文章(BMC Genomics 2014,15:244)比较了使用BAM文件作为输入的多种体细胞突变调用者,包括MuTect、具有简单减法的GATK UnifiedGenotyper、SomaticSniper、Strelka和VarScan2。这里,NIST-GIAB(由NIST主导的“瓶中基因组”联盟中的参考个体NA12878的变体集)被用作评价标准。毫不奇怪,一些算法的灵敏度高于使用相同标准的其他算法的灵敏度。虽然提供了一些指导,然而这种分析将不能够考虑到样本的变异,也不能够在提供固定输入集时识别检测限。此外,每种算法都被设计有潜在的假设,这些假设会影响分析计算平台的功效。
最近,开发了BAMBAM(参见US20120059670和US20120066001),其能够使用增量和同步定位导向比对来检测肿瘤和匹配的正常之间的变化。有利地,这种系统和方法能够检测等位基因的特异性变化,并且能够检测并表征小规模(例如,SNP)至大规模(例如,染色体内和染色体间重排)事件。此外,BAMBAM中的统计碱基调用方法能够适应于等位基因变体以及伪像和低质量读出,这在高通量测序中并不少见。虽然至少在理论上可以在序列分析算法中优化统计方法,但是没有已知的系统和方法利用各种计算机实现的算法或新算法来评估现有分析计算设备的变化或验证现有分析计算设备。
因此,仍然需要评估或验证特定遗传分析工具的性能的系统和方法,尤其是在分析是基因组分析的情况下。
发明内容
本发明的主题针对验证或校准基因组分析计算设备及其基因组分析算法的实现的多种系统和方法,以确保这些算法中的突变调用的质量和准确性。最优选地,所设想的系统和方法使用具有模拟肿瘤组织基因组的确定突变的第一多个虚拟基因组和模拟匹配的正常组织基因组的第二多个虚拟基因组。应当注意,数字虚拟基因组可以多种格式制作,特别是优选的格式包括表示整个基因组(或一条或多于一条染色体或其部分)的BAM文件,以及表示由虚拟基因组生成的模拟的测序序列的文件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南托米克斯有限责任公司,未经南托米克斯有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780041482.7/2.html,转载请声明来源钻瓜专利网。