[发明专利]基于深度卷积神经网络的番茄病害识别方法有效
申请号: | 201911268844.3 | 申请日: | 2019-12-11 |
公开(公告)号: | CN111046793B | 公开(公告)日: | 2023-05-02 |
发明(设计)人: | 张涛;朱显坤;张琨 | 申请(专利权)人: | 北京工业大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V10/774;G06V10/764;G06V10/82;G06N3/0464;G06N3/048;G06N3/045;G06N3/08 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100124 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 卷积 神经网络 番茄 病害 识别 方法 | ||
1.基于深度卷积神经网络的番茄病害识别方法,其特征在于:包括以下步骤:
(1)、扩充数据集
从AI CHALLENGER官方网站下载农业病害数据集,创建数据集,并通过官方的JSON文件对所有的农作物病害图片进行筛选,筛选出全部的番茄病害图片,创建番茄病害数据集;
提出了6种不同的增强方法对数据集进行扩充,数据增强方法之间扩充比例为1:1:1:1:1:5;
(2)、对图像数据集进行相关预处理;
由于数据集中的图片并不能直接用于网络模型的训练,需对数据集进行相关的预处理,预处理的步骤如下;
步骤2.1、将图像压缩到256*256的尺寸;
步骤2.2、对图像数据集中每张图像裁剪到224,有50%几率对图像随机进行水平、竖直翻转;
步骤2.3、将图像数据集随机生成10份数据集,每份数据集包含不同的训练集与验证集;训练集的数据占所有数据的90%,验证集的数据占所有数据的10%;
(3)、构建Residual 56 Attention Network网络模型,
获取到预处理后的数据集后,构建Residual 56 Attention网络,该Residual 56Attention网络模型的主干结构是由3个Attention module模块以及4个Residual交替拼接而成;网络模型的结构主体仍然是基于Residual Unit的Resnet网络结构;在网络的残差块部分位置加入另外的分支,构成一个整体的Attention Module;一个Attention Module分为两个分支,右边的分支就是普通的卷积网络,即主干分支,叫做Trunk Branch;左边的分支是为了得到一个掩码Mask,该掩码Mask的作用是得到输入特征的Attention Map,所以叫做Mask Branch,这个Mask Branch包含Down Sample和Up Sample的过程,目的是为了保证和右边分支的输出大小一致;在原有的Residual 56 Attention的所有的激活函数层均使用ELU函数作为激活函数;
Residual 56 Attention模型的最后一层为一个输出的全连接层,输出分类结果;
(4)、使用预处理后的数据集训练自己的网络模型;
构建好Residual 56 Attention网络模型后,开始使用自己的预处理后的数据集训练最优网络模型并自动保存;
步骤4.1、模型的训练方法采用标准的Adam优化算法对模型进行训练优化,训练时的batch size为32;
步骤4.2、训练120个epoch,让模型在训练过程中更关注目标区域;每个epoch之后模型都会对验证集进行验证,记录模型验证的准确率并输出;通过交叉验证进行训练,生成最终的模型作为最后结果;初始的学习率为0.001,在当前的学习率下,当验证数据集的训练轮数达到6次的同时标准评估停止提升时,降低学习速率,学习率将降低为当前学习率的0.1倍;
步骤4.3、保存最优模型,使用测试集的数据对模型分类的准确率做出评价。
2.根据权利要求1所述的基于深度卷积神经网络的番茄病害识别方法,其特征在于:训练平台基于Ubuntu系统,在Ubuntu系统上使用Keras深度学习框架实现;训练的GPU为一块GTX1080Ti,并使用CUDA作为显卡的运算驱动。
3.根据权利要求1所述的基于深度卷积神经网络的番茄病害识别方法,其特征在于:采用深度神经网络Residual 56 Attention,ResNet通过残差学习解决深度网络的退化问题,以训练出更深的网络的同时节省大量资源占用;ResNet-Attention 56在ResNet基础上引入了Attention机制,同时Residual 56 Attention的所有的激活函数层均使用ELU函数作为激活函数;在ResNet中,增加侧分支,侧分支通过一系列的卷积和池化操作,逐渐提取高层特征并增大模型的感受野,高层特征的激活对应位置能够反映attention的区域,然后再对这种具有attention特征的feature map进行上采样,使其大小回到原始feature map的大小,就将attention对应到原始图片的每一个位置上。
4.根据权利要求1所述的基于深度卷积神经网络的番茄病害识别方法,其特征在于:将输入的番茄病害图片压缩到256*256的尺寸,加快模型的训练,采用六种图像增强方式对数据集进行扩充,六种图像增强的数据集的比例为1:1:1:1:1:5;同时所有数据在进入模型前都做了批量正则化处理与随机裁剪。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911268844.3/1.html,转载请声明来源钻瓜专利网。