[发明专利]一种检测样本中宏病毒组的方法和系统有效
申请号: | 202111407911.2 | 申请日: | 2021-11-25 |
公开(公告)号: | CN114121160B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 林德春;陈江;金桃;张智闵;詹太平;蒋华 | 申请(专利权)人: | 广东美格基因科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B30/20 |
代理公司: | 杭州信与义专利代理有限公司 33450 | 代理人: | 万景旺 |
地址: | 518112 广东省深圳市南山区西丽街道西*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 检测 样本 宏病毒 方法 系统 | ||
本发明公开了一种检测样本中宏病毒组的方法,属于宏基因组分析技术领域,包括将待检测样本的二代测序数据和三代测序数据进行相互校正和混合组装,得到混合组装contigs,并将三代测序数据单独组装得到Nanopore contigs;进一步将所述混合组装contigs和Nanopore contigs分别进行比对注释,得到候选病毒contigs、非病毒contigs,和Nanopore病毒contigs;最后将3种数据集进行聚类分析,根据聚类结果进一步地综合分析,补充遗漏的病毒序列,并校正物种注释结果,得到更灵敏、准确且全面的病毒鉴定结果。
技术领域
本发明属于宏基因组分析技术领域,具体地,涉及一种检测样本中宏病毒组的方法和系统。
背景技术
随着宏基因组学的发展,越来越多的研究证明,病毒在不同生态系统中发挥着关键作用,因此对宏基因组数据进行病毒的分析是非常有必要的。
近年来,以高通量测序为基础的病毒宏基因组学技术以其时效性、高通量的优势,使得人们能够对不同类型样本进行微生物测序,对大量的不可培养的病毒进行研究。目前宏基因组测序方法主要包括二代测序(Next-generation Sequencing)和三代测序技术。二代测序因通量高、准确性高而广泛应用于病毒宏基因组领域;而三代测序技术中的纳米孔单分子测序平台(Oxford Nanopore Technologies,ONT)因速度快、测序读长长等优势,也越来越多应用于病毒宏基因组领域。然而,现有的病毒宏基因组学分析方法,存在如下不足:
(1)现有的病毒序列数据库不全,大量的新病毒未被测序,造成病毒序列的鉴定敏感性和准确性均较低;
(2)基于二代测序技术产生的contigs较短,鉴定的病毒序列完整度低;
(3)基于Nanopore测序平台产生的reads准确性较低,鉴定的病毒序列质量低。
发明内容
为了解决上述技术问题中的至少一个,本发明采取的技术方案如下:
本发明第一方面提供一种检测样本中宏病毒组的方法,包括以下步骤:
S1,分别获得待检测样本二代测序数据和三代测序数据;
S2,将所述二代测序数据和所述三代测序数据进行相互校正和混合组装,得到混合组装contigs,将三代测序数据单独组装得到Nanopore contigs;
S3,病毒鉴定与物种注释:
将所述混合组装contigs进行比对注释,得到候选病毒contigs和非病毒contigs,并对鉴定的病毒contigs进行物种注释,得到候选病毒的contigs的注释结果,
将所述Nanopore contigs进行比对注释,得到Nanopore病毒contigs,同样进行物种注释得到Nanopore病毒contigs的注释结果;
S4,病毒鉴定的校正:
S41,将候选病毒contigs、非病毒contigs和Nanopore病毒contigs三个数据集进行聚类分析,
S42,筛选出代表序列来自Nanopore病毒contigs的聚类单元,该聚类单元中如果某个非病毒contig能够比对上所述代表序列,则该非病毒contig作为遗漏的序列补充进候选病毒contigs,得到校正后的候选病毒contigs,将该聚类单元里的校正后的候选病毒contigs作为一个类病毒株,并使用代表序列的物种注释结果作为该类病毒株的注释结果,
S43,将不在筛选出的聚类单元里的每条候选病毒contig均作为类病毒株,与经过校正得到的类病毒株的注释结果进行汇总,得到最终的病毒鉴定结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东美格基因科技有限公司,未经广东美格基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111407911.2/2.html,转载请声明来源钻瓜专利网。