[发明专利]Kraken2软件输出结果的优化方法及鉴定样本中物种类型的方法在审
申请号: | 202011583243.4 | 申请日: | 2020-12-28 |
公开(公告)号: | CN112614544A | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王涛;肖姗姗;常壹昭 | 申请(专利权)人: | 杭州瑞普基因科技有限公司 |
主分类号: | G16B30/10 | 分类号: | G16B30/10;G16B50/00 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 刘雅婷 |
地址: | 311100 浙江省杭州市五常*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | kraken2 软件 输出 结果 优化 方法 鉴定 样本 物种 类型 | ||
1.一种Kraken2软件输出结果的优化方法,其特征在于,包括:
将测序结果中每个读段的子读段与已知数据库中的物种序列进行匹配,获取每个读段中匹配上每个物种的子读段的kmer数,选择每个读段中各kmer数中的最大值,记作kmermax数;
将所述kmermax数与第一阈值进行比较,当所述kmermax数小于等于第一阈值时,去除所述kmermax数对应的读段,以便对所有读段进行过滤。
2.根据权利要求1所述的方法,其特征在于,所述第一阈值为15~30。
3.根据权利要求1所述的方法,其特征在于,进一步包括:
将所述过滤后剩余的读段作为候选读段,每个所述候选读段中kmermax数对应的物种作为候选物种;
针对每个所述候选物种,选择所述候选物种匹配上的所有读段的kmer数之和,记作kmersum数;
将所述kmersum数与第二阈值进行比较,当所述kmersum数小于第二阈值时,去除所述kmersum数对应的候选物种,以便对所述候选物种进行过滤,去除不符合要求的物种,剩余物种为目标物种。
4.根据权利要求3所述的方法,其特征在于,所述第二阈值为900~1100。
5.根据权利要求3所述的方法,其特征在于,进一步包括:
将不同所述候选物种对应的kmersum数进行降序排列,当出现前一个kmersum数除以后一个kmersum数大于等于第三阈值且所述后一个kmersum数小于第二阈值时,所述前一个kmersum数及其之前的kmersum数所对应的候选物种为目标物种。
6.根据权利要求5所述的方法,其特征在于,所述第三阈值为3~5。
7.根据权利要求1所述的方法,其特征在于,所述测序结果的数量为10K-30M。
8.一种鉴定样本中物种类型的方法,其特征在于,包括:
(1)将样本进行宏基因组测序,得到测序结果;
(2)利用Kraken2软件对所述测序结果进行分析,并采用权利要求1~7任一项所述Kraken2软件输出结果的优化方法进行优化,以便确定所述样本中物种类型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州瑞普基因科技有限公司,未经杭州瑞普基因科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011583243.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种开放平台认证授权方法及装置
- 下一篇:一种电动汽车的充电控制系统