[发明专利]一种基于机器学习的蓝莓产量预测方法有效
申请号: | 202110163561.3 | 申请日: | 2021-02-05 |
公开(公告)号: | CN112906298B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 屈洪春;向蕊;张兴成;李元东 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N20/10;G06Q10/04;G06Q50/02 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 机器 学习 蓝莓 产量 预测 方法 | ||
本发明涉及一种基于机器学习的蓝莓产量预测方法,属于农作物产量预测技术领域。该方法包括:S1:生成模拟数据集:S2:数据预处理;S3:利用XGBoost选出最优特征子集;S4:构建基学习器,包括随机森林、梯度提升决策树、支持向量机;S5:构建多模型融合的Stacking集成学习元模型:选择Stacking模型集成策略将三种经过优化的基学习器作为模型第一层,将第一层基学习器的输出作为第二层元学习器的输入进行再训练,得到完整的模型;S6:评价元模型预测性能;S7:验证元模型;S8:计算特征重要性程度。本发明解决了农业系统中数据采集困难的问题,能够快速预测蓝莓产量,减少采集数据样本,提高预测精度。
技术领域
本发明属于农作物产量预测技术领域,涉及一种基于机器学习的蓝莓产量预测方法。
背景技术
蓝莓与小麦、玉米等常见秸秆类作物不一样,它属于灌木丛生类作物。它的产量和大多数具有花期的作物一样,会受到蜜蜂、壁蜂等蜂类物种丰度、温度、降雨量、土壤以及一些其它环境因素的因素,但不同的是,蓝莓产量还会与其丛的扩散范围大小有关。蓝莓产量与这些因素并不总是成简单的线性关系,如温度、降雨量以及其它环境因素对蜜蜂生长发育的影响可能会导致田间蜜蜂密度和类群组成的变化,进而影响授粉服务的质量,其他管理活动、景观特征和丛的扩散范围大小也可能影响蜜蜂活动,从而对产量产生影响。这些因素导致各变量和蓝莓产量之间的关系变得愈加复杂,无法依据传统经验和方法直接预测。
目前,农业中最重要和最具挑战的任务是如何准确预测作物产量。种植者以往都是根据历史数据和经验对作物生长趋势做出预判后采取措施,以此提高作物收成。近年来,机器学习因能很好地处理非线性问题被越来越多的研究人员应用到各个领域。典型的机器学习算法通常使用真实的数据来进行模型的训练,从而预测作物产量。但真实的农业数据的采集往往周期很长,成本较高,并且不一定全面,所以不能保证收集的数据一定能够有效的训练机器学习模型,这也是目前农业部门面临的巨大挑战。
利用仿真模型生成的模拟数据训练的机器学习模型被称为元模型。如果元模型预测数据与仿真模型模拟数据之间的误差较小,那么与直接使用任何一种仿真模型相比,它具有两个明显的优势。在一方面,元模型能够称为模拟模型的替代品,相比于仿真模型,元模型可以提供更快的执行速度,减少存储需求,并增加灵活性。另一方面,元模型可以通过查找模拟数据中的模式或聚类来“学习”输入变量和输出变量之间的连接,实时做出的合理预测,对于跨大型地理区域或高维因子空间进行快速筛选更有价值。目前,元模型已被科学界所接受。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110163561.3/2.html,转载请声明来源钻瓜专利网。