[发明专利]基因测序分析方法、装置、存储介质和计算机设备在审
申请号: | 202110698855.6 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113299344A | 公开(公告)日: | 2021-08-24 |
发明(设计)人: | 杨姣博;晋向前;贺增泉;于闯;张优劲 | 申请(专利权)人: | 深圳华大医学检验实验室 |
主分类号: | G16B30/00 | 分类号: | G16B30/00;G16B50/00;G06F9/50 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 陈嘉雯 |
地址: | 518000 广东省深圳市盐田*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基因 分析 方法 装置 存储 介质 计算机 设备 | ||
本发明提供的基因测序分析方法、装置、存储介质和计算机设备,首先将测序平台实时传入的短序列进行分切片处理后得到对应的切片处理,然后将切片数据输入内存中,以便调用内存中预先加载的封装程序对切片数据进行生信分析,得到对应的分析结果;该过程无需等待测序平台完全测序完毕后将整个测序结果传输至对应平台进行处理分析,而是实时获取测序平台测序后的切片数据,对切片数据进行流式测序及分析,因而本申请能够从整体上加快测序与分析的进程,且分析时的数据为切片数据,该切片数据相对于整个测序结果而言,传输速度更快,耗时更短。
技术领域
本发明涉及生物信息技术领域,尤其涉及一种基因测序分析方法、装置、存储介质和计算机设备。
背景技术
DNA测序技术自发明以来就一直在推动分子生物学发展方面起着至关重要的作用。从早期Frederick Sanger的手工测序,以及基于Sanger法开发的第一代自动化测序仪,到目前的新一代测序平台,这一领域已经发生了巨大的变化。
新一代测序平台的测序过程主要是在每一轮测序循环中,标记不同荧光基团的4种核苷酸以及DNA聚合酶同时加入流通池通道中,按照碱基互补配对原则进行DNA链的延伸;接着采集荧光图像,碱基特异的荧光标记揭示了这一轮中新加入的核苷酸是什么,也就获得了模板中这一位置的DNA序列;然后,继续进行下一轮反应。这一过程重复多次后得到多个DNA序列,比如进行50轮测序循环后,将产生50个碱基的DNA序列,且由于该方法获得的单条序列长度很短,因此叫做短序列。
由上述内容可见,新一代测序平台需要在生化和成像运行完后,再统一进行碱基识别,然后将识别结果转化成其他形式进行存储;之后将存储后的文件传输到一级存储中进行数据质控,校验样本信息和上机信息,再使用二级存储进行数据归档;该测序阶段耗时较长,传输效率较低,导致分析过程较慢。
发明内容
本发明的目的旨在至少能解决上述的技术缺陷之一,特别是现有技术中测序阶段耗时较长,传输效率较低,导致分析过程较慢的技术缺陷。
本发明提供了一种基因测序分析方法,所述方法包括:
获取切片数据,所述切片数据为测序平台实时传入的,对测序文库进行至少一轮测序循环后所读取的短序列集合;
将所述切片数据输入内存中;
调用所述内存中预先设置的封装程序,对所述切片数据进行数据处理及检测分析,得到对应的分析结果;其中,所述封装程序为自定义程序。
可选地,所述获取切片数据的步骤,包括:
确定切片大小;
根据所述切片大小对测序平台当前传入的、所有未切分的、单轮测序循环后读取的短序列进行切分,并将切分后的短序列集合作为切片数据。
可选地,所述确定切片大小的步骤,包括:
获取当前CPU的空闲情况;
依据所述当前CPU的空闲情况调整切片大小。
可选地,所述封装程序包括数据质控程序、数据处理程序和检测分析程序;
所述调用所述内存中预先设置的封装程序,对所述切片数据进行数据处理及检测分析,得到对应的分析结果的步骤,包括:
调用所述内存中预先设置的数据质控程序,对所述切片数据进行质量控制处理,得到质控结果;
调用所述内存中预先设置的数据处理程序,对所述质控结果进行数据处理,得到处理结果;
调用所述内存中预先设置的检测分析程序,对所述处理结果进行检测分析,得到最终的分析结果。
可选地,所述调用所述内存中预先设置的数据质控程序,对所述切片数据进行质量控制处理的步骤,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳华大医学检验实验室,未经深圳华大医学检验实验室许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110698855.6/2.html,转载请声明来源钻瓜专利网。