[发明专利]Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法在审
申请号: | 202011583243.4 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112614544A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王涛;肖姗姗;常壹昭 | 申请(专利权)人: | 杭州瑞普基因科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B50/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 刘雅婷 |
地址: | 311100 浙江省杭州市五常*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | kraken2 软件 输出 结果 优化 方法 鉴定 样本 物种 类型 | ||
本发明提出了Kraken2软件输出结果的优化方法,所述方法包括:将测序结果中每个读段的子读段与已知数据库中的物种序列进行匹配,获取每个读段中匹配上每个物种的子读段的kmer数,选择每个读段中各kmer数中的最大值,记作kmermax数;将所述kmermax数与第一阈值进行比较,当所述kmermax数小于等于第一阈值时,去除所述kmermax数对应的读段,以便对所有读段进行过滤。本发明的方法可以准确地优化Kraken2软件输出结果,避免出现假阳性现象,可以应用于鉴定样本中物种类型。
技术领域
本发明涉及生物领域。具体地,本发明涉及Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法。
背景技术
宏基因组是指特定环境下所有生物遗传物质的总和,以其作为研究对象,通过测序分析、功能基因筛选等方式可以获取样本中的生物组成及生物之间、生物和环境之间的关系。
宏基因组测序简称mNGS,即metagenomics next generation sequencing,是一种对环境中所有生物基因组不加分离进行混合测序的技术。
病原微生物,指能使人或动物致病的微生物。包括寄生虫、真菌、细菌病毒等。
mNGS可以实现对样本中所有的微生物进行鉴定,并且可以鉴定新的物种,这是采用常规的实验方法如涂片、生化鉴定、培养鉴定及基于多重PCR的检测技术所无法实现的。mNGS因无需培养、不依赖探针序列、无偏好覆盖广等优点,在临床疑似病原体、罕见病原体、急危重症等临床感染病原检测应用较广。
mNGS检测的是样本中所有生物的基因组。在检测前,样本中的微生物组成大多情况下是未知的。检测时需要将测序得到的read和已知的数据库进行比对来确认其表达通路或物种组成等。
用于序列比对的知名工具BLAST可以对较长的序列得到较好的比对结果,但该工具应用于高通量测序得到的短序列数据时效果欠佳。此外,由于mNGS进行物种判定时往往需要和大型的数据库进行匹配,BLAST的比对速度限制了其在临床检测等时间紧迫的场景中的应用。
Kraken2软件是一款常用的mNGS物种鉴定工具,其在建库时构建各物种独特的kmer,并在比对时将每条read的上的kmer情况进行统计。Kraken2具有极快的运行速度,但由于其默认对结果不进行筛选,导致原始结果中假阳性率非常高,可以达到85%以上。
发明内容
本发明旨在至少在一定程度上解决现有技术中存在的技术问题至少之一。为此,本发明提出了Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法,该方法可以有效地优化Kraken2软件输出结果,准确获知物种类型,从而可以应用于样本中物种类型的鉴定,降低假阳性率。
本发明提出了一种Kraken2软件输出结果的优化方法。根据本发明的实施例,所述方法包括:将测序结果中每个读段的子读段与已知数据库中的物种序列进行匹配,获取每个读段中匹配上每个物种的子读段的kmer数,选择每个读段中各kmer数中的最大值,记作kmermax数;将所述kmermax数与第一阈值进行比较,以便对所有读段进行过滤,去除不符合要求的读段。
根据本发明实施例的优化方法中,对Kraken2软件的output参数输出文件中的每一条read,统计其匹配到物种的kmer数的最大值,并将该最大值与第一阈值进行比较,筛选出不符合要求的读段,从而以便于对所有读段进行过滤,提高结果准确性,避免出现假阳性现象。
根据本发明的实施例,上述Kraken2软件输出结果的优化方法还可以具有下列附加技术特征:
根据本发明的实施例,所述第一阈值为15~30。由此,可以去除小于等于15~30的kmermax数所对应的读段,避免其干扰,导致检测结果不准确,出现假阳性现象。需要说明的是,本发明所描述的第一阈值是指15~30中的任意一个具体数值,例如20。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州瑞普基因科技有限公司,未经杭州瑞普基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011583243.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种开放平台认证授权方法及装置
- 下一篇:一种电动汽车的充电控制系统