[发明专利]基于宏基因组学的病原分析方法、分析装置、设备及存储介质在审
申请号: | 202010656441.2 | 申请日: | 2020-07-09 |
公开(公告)号: | CN111951895A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 张鑫磊;王勇强;陈俊如 | 申请(专利权)人: | 苏州协云基因科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B40/00 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 戴志攀 |
地址: | 215123 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 宏基 病原 分析 方法 装置 设备 存储 介质 | ||
本发明涉及一种基于宏基因组学的病原分析方法、分析装置、设备及存储介质。本发明所提出的基于宏基因组学的自动化病原分析方法,一方面整合优化了数据分析方法流程和工具,对病原鉴定过程进行标准化,能够大幅提速数据分析时间,缩减临床检测周期,实现快速检测。另一方面平台通过建立微生物参考序列数据库和病原信息库,综合评估参数和证据等级来有效区分病原菌与背景菌,可有效防止因未覆盖而导致的漏检,进一步提升临床检测结果的参考意义和可解读性。
技术领域
本发明涉及生物信息学技术领域,特别是涉及一种基于宏基因组学的病原分析方法、分析装置、设备及存储介质。
背景技术
宏基因组测序(metagenomic next-generation sequencing,mNGS)是综合分析来自患者样本的微生物和宿主的基因物质(DNA和RNA)的方法,应用于多种感染性疾病的诊断、疾病和健康状态下病原微生物分析。其检测通量高,靶标涵盖几乎所有潜在病原,非常适合发现新发病原体和不明感染源。mNGS以无需纯化培养、全面快速检测样本中的所有潜在病原体在相关领域得到认可,同时mNGS具有更高的病原体鉴定灵敏度,受抗生素的影响较小。因此,mNGS对检测传染性病原体具有重要的潜力及实用意义。
虽然mNGS已经在相关应用中取得不错的成绩,但是要提供“一站式”成熟的解决方案,传统的mNGS在实验重复性、结果可靠性及解读准确性方面仍然存在不足,对mNGS的标准化造成障碍。
发明内容
基于此,有必要提供一种重复性、可靠性和准确性较好的基于宏基因组学的病原分析方法。
一种基于宏基因组学的病原分析方法,包括以下步骤:
步骤S1:根据待测样品的测序数据获取序列信息;
步骤S2:对所述序列信息进行质控分析,去除质量不合格的序列和宿主序列,得到目标序列数据;
步骤S3:基于微生物参考序列数据库,从所述目标序列数据中分析得到微生物物种分类数据;
步骤S4:基于病原信息库,从所述微生物物种分类数据中分析得到与疾病相关的病原数据;
步骤S5:根据所述病原数据输出所述待测样品的病原检测结果。
在其中一个实施例中,所述步骤S2包括以下步骤:
步骤S21:从所述测序数据中识别并去除碱基错误率大于1%的序列,得到合格序列数据;
步骤S22:从所述合格序列数据中识别并去除宿主序列,得到所述目标序列数据。
在其中一个实施例中,所述步骤S3包括以下步骤:
步骤S31:将所述目标序列数据与所述微生物参考序列数据库进行比对,得到第一比对结果;
步骤S32:按照一致性大于90%、覆盖度大于90%且比对分值小于最优分值的110%的标准对所述第一比对结果进行过滤,得到第二比对结果;
步骤S33:根据所述第二比对结果的基因信息标识编号获取对应的物种编号,并根据物种编号获取物种注释信息,然后对所述第二比对结果中的每条序列进行物种鉴定;
步骤S34:分别统计每一个分类层级上鉴定到的每一种微生物的序列数目,作为该微生物的初始丰度值;
步骤S35:矫正每一种微生物的所述初始丰度值。
在其中一个实施例中,在步骤S33中采用LCA算法进行物种鉴定,和/或在步骤S35中采用RPM算法矫正所述初始丰度值。
在其中一个实施例中,所述步骤S4包括以下步骤:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州协云基因科技有限公司,未经苏州协云基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010656441.2/2.html,转载请声明来源钻瓜专利网。