[发明专利]一种宏基因组测序数据自动化分析方法在审

专利信息
申请号: 202011254551.2 申请日: 2020-11-11
公开(公告)号: CN112289375A 公开(公告)日: 2021-01-29
发明(设计)人: 罗奇斌;申玉林;廖胜光;任毅 申请(专利权)人: 天津奇云诺德生物医学有限公司
主分类号: G16B20/30 分类号: G16B20/30
代理公司: 暂无信息 代理人: 暂无信息
地址: 300457 天津市*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 宏基 序数 自动化 分析 方法
【说明书】:

发明涉及生物信息领域,且公开了一种宏基因组测序数据自动化分析方法,包括原始下机数据过滤和质量控制、宿主基因组比对、肠道菌群物种注释和比对、肠道菌群代谢潜能分析、结果统计和输出等步骤。所有步骤使用Python脚本连接实现自动化分析,减少了繁琐的人工操作,降低了人工操作带来的各种错误。自动化分析方法的分析内容涵盖了大部分宏基因组分析的内容,可满足研究人员的分析需求,流程在运行时不仅会输出各步骤产生的中间结果,也会对相应的数据做统计分析及整理,输出相应的图表,方便使用者的浏览,同时流程运行日志记录所有流程相关信息,方便在流程运行出错时进行筛查。

技术领域

本发明涉及生物信息领域,具体为一种宏基因组测序数据自动化分析方法。

背景技术

宏基因组(Metagenome)也称微生物环境基因组,是指环境中全部为生物遗传物质的总和,研究对象为环境样本中的微生物群体基因组,常见的研究方法包括功能基因筛选、测序分析等。近年来,微生物组与人体健康之间的关系已成为研究热点,特别是基于高通量测序的宏基因组技术推动了此领域的发展,要了解肠道微生物对人类健康的影响,需阐明肠道微环境的组成、多样性和功能等。由美国国立卫生研究院启动的人类微生物组计划从300个美国人的不同人体部位产生了大量16S rRNA基因数据集,然而16S rRNA基因基于扩增片段的分析只能检测到属及以上级别的微生物,这表示分类学多样性和功能在种及其以下水平被忽略。宏基因组测序目标是整个基因组DNA序列,已用于人类肠道微生物群,可检测物种水平的微生物,更适合于肠道微生物组和人类疾病之间的关联研究。

宏基因组测序数据分析过程一般包括原始数据质控、序列比对、物种注释分析、相关丰度鉴定等,在获取菌群相关丰度后根据研究内容再进行后续分析。数据质控常用软件是Trimmomatic软件,修剪去除原始数据中的接头(Adapter)和低质量序列;序列比对常使用Bowtie2软件对比人类基因组参考序列,并去除比对上的序列,剩余序列即为肠道微生物组序列,其他常见软件还包括SOAP、BWA、Martin等;物种注释分析即将与人类基因组比对过滤后的数据和菌群参考基因组再次进行比对及注释,最后根据物种分类信息对丰度进行统计,常用的注释且带有统计功能的软件有MetaPhlAn2、Kraken、Genometa等。

随着高通量测序成本的下降,测序数据的增多和信息分析需求增大,宏基因组研究中需要能快速分析测序结果。而上述过程中使用的软件使用环境、输入输出数据类型和数据结构等方面不尽相同,因此需要人工对分步结果进行整理和衔接,增加人工成本。

目前尚无宏基因组自动化分析平台或开源流程来解决需要人工对中间分步结果等进行整理和衔接的问题,因此,设计一种宏基因组测序数据自动化分析方法,涵盖了市场所需大部分分析内容,能够自动化完成各部分分析后对结果进行统计、归类和整理,具有现实意义和良好的应用前景。

发明内容

针对上述背景技术中的不足,本发明提供了一种宏基因组测序数据自动化分析方法,即使用Python脚本将需要使用的软件串联起来,并进行结果统计分析等自动化操作,流程中涵盖了市场所需的大部分分析内容,自动化进行宏基因组分析,输出中间结果的同时对数据进行分析整理和统计,并记录完备的流程运行日志,不仅满足研究人员分析需求,还避免了人工原因导致的错误,同时完备的流程运行日志也便于后续查错纠错。

为实现上述目的,本发明提供如下技术方案:

一种宏基因组测序数据自动化分析方法,其特征在于,包括如下步骤:

1. 原始下机数据过滤和质量控制步骤:使用Python脚本进行原始数据的过滤,调用Trimmomatic软件去除接头序列和低质量序列,同时将质控结果输出到单独的文件夹中,方便查看;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津奇云诺德生物医学有限公司,未经天津奇云诺德生物医学有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011254551.2/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top