[发明专利]一种基于高通量测序数据的枯萎病发病预测模型及应用在审
申请号: | 202010160122.2 | 申请日: | 2020-03-10 |
公开(公告)号: | CN111243676A | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 袁军;沈其荣;文涛 | 申请(专利权)人: | 南京农业大学 |
主分类号: | G16B40/00 | 分类号: | G16B40/00;G16B30/00;G16B5/00 |
代理公司: | 南京天华专利代理有限责任公司 32218 | 代理人: | 莫英妍;徐冬涛 |
地址: | 211225 江苏省南京市溧*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通量 序数 枯萎病 发病 预测 模型 应用 | ||
本发明提出一种基于高通量测序数据的枯萎病发病预测模型及应用,通过整合不同地域、不同作物的枯萎病患病土壤和健康土壤的微生物高通量测序数据,利用机器学习方法分析患病土壤和健康土壤中细菌群落和真菌群落的特征,获取45个细菌和40个真菌的分类操作单元相对丰度特征用于辨别健康土壤和枯萎病发病土壤,并分别建立细菌模型和真菌模型,实现准确判别土壤枯萎病的发病情况,揭示枯萎病患病土壤微生物群落特征。
技术领域
本发明属于农业植物保护技术领域,尤其是一种基于高通量测序数据的枯萎病发病预测模型及应用。
背景技术
微生物对人类活动至关重要。土壤微生物群落与我们的生活密切相关,特别是与我们的农业实践密切相关,深刻影响农产品的质量和数量。镰刀菌枯萎病作为土传病害的典型代表,在世界范围内极大的影响农作物的生产。在田间已分离和试验了数百种对枯萎病菌和镰刀菌有抑制作用的有益微生物。镰刀菌枯萎病虽然是由尖孢镰刀菌引起的真菌病害,病原菌数量增加必然导致发病率上升。但是目前仍然无法以病原菌数量来预测病害的发生。因为不同土壤条件、土壤间微生物的相互作用均能影响发病情况。
在过去的十几年中,通过高通量测序(HTS)方法逐渐明确了镰刀菌(Fusarium)发病和健康土壤微生物群落的特征。因此,我们在全球范围内,通过公开发表的镰刀菌枯萎病相关研究获取枯萎病土壤微生物群落的原始测序数据,并考虑了方法学和技术上的缺陷,使用多种机器学习方法来分析患病或健康土壤中细菌和真菌群落的特征,并基于此构建区分枯萎病发病和健康微生物群落的分类模型。
发明内容
本发明所解决的技术问题在于提供一种基于高通量测序数据的枯萎病发病预测模型,通过整合不同地域、不同作物的枯萎病患病土壤和健康土壤的微生物高通量测序数据,利用机器学习方法分析患病土壤和健康土壤中细菌群落和真菌群落的特征,并分别建立细菌模型和真菌模型,实现准确判别土壤枯萎病的发病情况。
实现本发明目的的技术解决方案为:
一种基于高通量测序数据的枯萎病发病预测模型,包括以下步骤:
步骤1:数据收集:使用关键词从数据库中获取枯萎病相关的土壤微生物群落的测序样品登录号,进而获取枯萎病相关的土壤微生物群落的原始测序数据;
步骤2:数据处理:将土壤微生物群落的测序数据分为细菌原始测序数据和真菌原始测序数据,分别进行处理和分析;
步骤3:将土壤中的细菌群落和真菌群落作为生物标志物来区分枯萎病发病土壤和健康土壤,应用机器学习模型随机森林RF对区分枯萎病发病土壤和健康土壤的细菌群落和真菌群落分别建立分类模型:
步骤3-1:构建用于区分枯萎病发病土壤微生物群落和健康土壤微生物群落的细菌模型:
使用随机森林创建分类模型,利用RF软件包(版本号:v.4.6-14)的randomForest函数构建随机森林模型并设置参数ntree=1000,其他参数保持默认,将细菌群落组成的相对丰度按门、纲、目、科、属、种和OTU等级别进行建模,获得最佳预测模型的细菌分类级别;
对于每个细菌群落分类级别,将所有整合得到的细菌测序样本随机分为两部分,一部分占全部样本的三分之二,用于模型构建,另一部分占总样本三分之一,用于细菌模型预测,这个过程重复五次,通过模型预测数据评估最佳模型,从而获得预测准确率最高的分类级别;
在准确率最高的分类级别上,将步骤2中的整合的全部细菌原始测序数据组成训练集,使用相同的模型并设置相同的参数继续训练模型,进而优化所生成的预测枯萎病发病的细菌模型;
通过交叉检验提取出来对模型影响最大的若干个OTU。
步骤3-2:构建用于区分枯萎病发病土壤微生物群落和健康土壤微生物群落的真菌模型:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京农业大学,未经南京农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010160122.2/2.html,转载请声明来源钻瓜专利网。