[发明专利]全基因组重测序分析及用于全基因组重测序分析的方法有效
申请号: | 201910989715.7 | 申请日: | 2019-10-17 |
公开(公告)号: | CN110797088B | 公开(公告)日: | 2020-09-15 |
发明(设计)人: | 张凯;沈一鸣 | 申请(专利权)人: | 南京医基云医疗数据研究院有限公司 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B20/00;G16B50/30 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 袁礼君;孙宝海 |
地址: | 210000 江苏省南京市江北新区*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因组 重测序 分析 用于 方法 | ||
本发明公开一种全基因组重测序分析及用于全基因组重测序分析的方法。所述用于全基因组重测序分析的方法包括:获取对待检测样本的DNA序列进行识别所得到的多条测序序列;将所述多条测序序列分成多个测序序列组;基于每个测序序列组,并行地执行如下操作:依次地或并行地将所述测序序列组中的各条测序序列与参考基因组进行测序序列对比,确定每条测序序列在所述参考基因组上的对应位置及对应的染色体编号;以及根据每条测序序列在所述参考基因组上的对应位置及对应的染色体编号,对各条测序序列进行排序和去重,生成对应各染色体的测序序列库。
技术领域
本发明涉及基因测序领域,具体而言,涉及一种全基因组重测序分析及用于全基因组重测序分析的方法。
背景技术
全基因组重测序是指对具备参考基因组的物种中的不同个体进行基因组测序,并识别出样本个体基因与参考基因组的差别。随着大众对人类基因组认知水平的提高,全基因组重测序在医学、鉴定等领域发挥着越来越重要的作用。
现阶段,全基因组重测序包括实验和数据分析两大步骤:1)使用二代测序仪,将输入样本的DNA序列识别为测序序列;2)通过数理统计方法,确定二代测序仪输出的测序序列与参考基因组之间的差异。
对于步骤2),目前通常采用BWA、Samtools、GATK等开源软件分别完成全基因组重测序数据分析所需的测序序列对比、排序、去重、质量值校正及变异识别等标准流程。然而,只有BWA和Samtools软件具有并行化处理能力,其它标准流程所使用的软件均为串行工具,其数据处理时间长,难以充分利用多核CPU资源。
此外,由于全基因重测序的每一流程均由不同的软件实现,软件与软件之间将存在大量需要输出至硬盘的中间文件,且全基因重测序的数据处理极为密集:以目前研究最多的人类全基因组重测序为例,其产生的中间文件总计将超过300G。为了减小中间文件,前一软件输出中间文件时往往对其进行特定格式的压缩,后一软件输入中间文件时需要对其进行解压。如此大量中间文件的频繁读写也将严重降低准备测序序列库和数据分析的速度与效率。
在所述背景技术部分公开的上述信息仅用于加强对本发明的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
有鉴于此,本发明提供一种用于全基因组重测序分析的方法、全基因组重测序分析方法、装置、电子设备及计算机可读存储介质。
本发明的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本发明的实践而习得。
根据本发明的一方面,提供一种用于全基因组重测序分析的方法,包括:获取对待检测样本的DNA序列进行识别所得到的多条测序序列;将所述多条测序序列分成多个测序序列组;基于每个测序序列组,并行地执行如下操作:依次地或并行地将所述测序序列组中的各条测序序列与参考基因组进行测序序列对比,确定每条测序序列在所述参考基因组上的对应位置及对应的染色体编号;以及根据每条测序序列在所述参考基因组上的对应位置及对应的染色体编号,对各条测序序列进行排序和去重,生成对应各染色体的测序序列库
根据本发明的一实施方式,根据每条测序序列在所述参考基因组上的对应位置及对应的染色体编号,对各条测序序列进行排序和去重,生成对应各染色体的测序序列库包括:基于每个测序序列组,并行地执行如下操作:根据所述测序序列组中各条测序序列对应的染色体编号,确定每条测序序列的所属染色体;以及基于每个染色体,并行地执行如下操作:根据所述染色体中各条测序序列在所述参考基因组上的对应位置,依次地对各条测序序列进行排序和去重,生成对应所述染色体的测序序列库。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京医基云医疗数据研究院有限公司,未经南京医基云医疗数据研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910989715.7/2.html,转载请声明来源钻瓜专利网。