[发明专利]一种基于神经网络和迁移学习的水果图像分类方法及装置在审
申请号: | 201811120209.6 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109272045A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 王卫星;黄仲强;姜晟;赖俊桂;韩清春 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 510630*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 水果图像 像素点 迁移 正态分布 预处理 分类 分类模型 数据增强 图像 学习 归一化操作 识别和分类 尺寸图像 分类结果 时间成本 算法 输出 | ||
1.一种基于神经网络和迁移学习的水果图像分类方法,其特征在于,包括:
将待分类的图像进行预处理,经预处理后再结合SMOTE算法进行数据增强;
将数据增强后的图像的像素点进行BN批量归一化操作,使所述像素点符合正态分布;
将所述正态分布的像素点输入基于神经网络和迁移学习的水果图像分类模型,输出所述图像的分类结果。
2.如权利要求1所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,将待分类的图像进行预处理,包括:
将待分类的图像处理尺寸为299*299像素的图像。
3.如权利要求1所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,所述数据增强的方式包括以一种或多种:
缩放:将图像尺寸缩放80~120%,数据增加至2倍;
镜像翻转:将原始图像进行垂直和水平反转,将图像数据扩充2倍;
高斯噪声:将原始图像中添加一些高斯噪声,将图像数据扩充2倍;
颜色抖动:增强或减弱原始图像对比度,将图像数据扩充2倍;
旋转图片:对原始图像进行旋转45度,将图像数据扩充2倍。
4.如权利要求1所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,所述结合SMOTE算法进行数据增强,公式如下:
式中:特征向量xi,i∈{1,......,T},T个样本,i为样本编号,ζ为0~1之间的随机数。
5.如权利要求1所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,所述基于神经网络和迁移学习的水果图像分类模型由下述步骤训练生成,包括:
采集大量水果图像,进行预处理;经预处理后再结合SMOTE算法,进行数据增强;
将数据增强后的图像的像素点进行BN批量归一化操作,使所述像素点符合正态分布;
构建一个卷积神经网络模型;所述卷积神经网络模型包含一个含有CNN、分类神经网络、输出网络三部分的卷积;
将inceptionV3模型在ImageNet数据集上训练的权重迁移至所述卷积神经网络模型上;
将所述正态分布的像素点输入迁移后的所述卷积神经网络模型,进行一次前向传播,输出得出每一分类得分值,通过softmax函数,得出每一类的概率值;
计算所述得分值与所述真实分类之间的loss值;
使用反向传播算法,根据随机梯度下降算法沿着所述loss值下降的方向微调权重系数w;
当所述loss值趋向收敛时,停止训练,生成基于神经网络和迁移学习的水果图像分类
模型。
6.如权利要求5所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,在计算所述得分值与所述真实分类之间的loss值步骤之后,使用反向传播算法之前,包括:
加L2正则化trick操作。
7.如权利要求5所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,计算所述得分值与所述真实分类之间的loss值,通过下述公式计算:
a=σ(z),z=∑xjyj+b
其中,C表示预测值与真实值之间的差值,m表示训练过程中样本总数量,x表示输入值,b表示偏置值,y表示真实标签值,a表示卷积神经网络物体的预测值,σ表示激活函数,z表示得分值,K为惩罚项因子。在预测模型中,K超参数取2.0。
8.如权利要求5所述的基于神经网络和迁移学习的水果图像分类方法,其特征在于,当所述loss值趋向收敛时,停止训练;包括:
采用EarlyStopping的训练方法,经过10个epoch之后,验证集loss相比上一个epoch没有下降,则停止训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811120209.6/1.html,转载请声明来源钻瓜专利网。