[发明专利]一种基于大数据预测核心微生物组的方法在审
申请号: | 202110901600.5 | 申请日: | 2021-08-06 |
公开(公告)号: | CN113656565A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 钱海丰;张琦;张振炎 | 申请(专利权)人: | 浙江工业大学 |
主分类号: | G06F16/332 | 分类号: | G06F16/332;G06F16/335;G16B40/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
地址: | 310014 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 预测 核心 微生物 方法 | ||
本发明公开一种基于大数据预测核心微生物组的方法,该方法基于公共数据库中可获取的16S rRNA基因高通量测序数据,通过对所有独立实验的测序数据的质控、过滤、合并和注释,得到归一化的微生物数据表格,从中获取每个物种基于独立实验数和样本数的检出频率以及每个微生物物种的相对丰度。通过整合和量化这几个因子构建物种(基于标准的物种进化树分类水平)的核心指数计算公式,从而确定某一类微生物群落的核心微生物组。本发明方法基于公开的16S rRNA基因测序数据库,能够便捷预测环境中相似类型环境介质和亲缘宿主相关的核心微生物组,且呈现较高可信度,可广泛应用于微生物研究体系的预测,增加研究的普适性。
技术领域
本发明属于环境微生物技术领域,具体涉及一种基于大数据预测核心微生物组的方法。
背景技术
微生物技术的发展给医学、农业、环境和生态等领域的研究带来的前所未有的革新。其中“核心微生物组”这一概念逐渐受到关注,起完善微生物功能的作用。如植物的“核心微生物组”与植物相关的微生物组的组装过程中非常关键,不局限于促进宿主植物的生长。如果合理利用这些核心微生物,可以通过招募具有不同功能以及高抗病的本土微生物,来协调组织植物—微生物以及微生物—微生物的相互作用,促进作物健康生长并提高作物的产量;在人类肠道中的“核心微生物组”与消化、代谢、免疫功能息息相关,“核心微生物组”的确定有助于进一步通过药物和饮食来调节肠道菌健康。但是,单一实验室测试耗时、耗力和耗财,且非普适性;同时,核心菌群的鉴定也会受到不同的实验方法、PCR引物、测序深度等技术操作的影响。因此,现阶段需要构建一个标准化定义核心菌群的方法用于快速、准确确定目标微生物群落的核心微生物组。
近十年,微生物测序技术的蓬勃发展、公开数据的倡导以及各类公开数据库的完善,为获取和合并微生物测序数据提供有效保障。在检索搜集上,通过关键词就可以获取大量的目标菌群数据。在数据处理上,Vsearch、Usearch、QIIME和QIIME2数据处理平台的发展提供了数据归一化的技术支持。鉴于使用大数据方法收集的同一类目标菌群具有广谱性和异质性,所以基于大数据确定的核心菌群更具有普适性和代表性。
发明内容
本发明针对现有技术不足,提供了一种基于大数据预测核心微生物组的方法,该方法能够快速、准确鉴定目标微生物群落的核心微生物组,并且使其具有普适性和代表性。本发明的目的是通过如下技术方案实现的:一种基于大数据预测核心微生物组的方法,所述方法包括如下步骤:
(1)确定目标系微生物群落,根据关键词“目标+microbial community”、“目标+16S rRNA”、“目标+microbiome”和“目标+microbiota”检索文献,找到相关独立实验,整合所有获取的文献内容以及确定数据集的可获取性和可利用性。
(2)通过统计整合后的数据集信息表格,得到每个独立实验的实验信息,统一在线数据库获取每个独立实验的测序原始数据。所述测序原始数据是完整的,包括但不限于双端和单端测序的数据。
(3)分析对每个独立实验的测序原始数据进行质量过滤、双端合并、样品合并、序列去冗余、聚类并且去除嵌合体,得到序列和OTU表格。
(4)将每个独立实验得到的序列和OTU表格导入QIIME2中进行不同实验的数据合并、物种注释、宿主序列去除和序列抽平,获得归一化物种表格和每个物种的检出序列数。
(5)选取一个物种分类水平作为核心微生物组的基础分类,从步骤(4)得到的归一化物种表格中筛选出每个独立实验检出的物种在该独立实验所有样品中的检出频率大于50%,然后根据这些物种进行计算所有独立实验中的检出频率。
(6)以获取的所有独立实验的样品数为基础,计算每个物种的检出频率。
(7)根据步骤(4)得到的每个物种的检出序列数除以步骤(4)中抽平的序列数计算出每个物种的相对丰度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江工业大学,未经浙江工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110901600.5/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置