[发明专利]一种基于神经网络和迁移学习的水果图像分类方法及装置在审
申请号: | 201811120209.6 | 申请日: | 2018-09-25 |
公开(公告)号: | CN109272045A | 公开(公告)日: | 2019-01-25 |
发明(设计)人: | 王卫星;黄仲强;姜晟;赖俊桂;韩清春 | 申请(专利权)人: | 华南农业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京慕达星云知识产权代理事务所(特殊普通合伙) 11465 | 代理人: | 李冉 |
地址: | 510630*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 神经网络 水果图像 像素点 迁移 正态分布 预处理 分类 分类模型 数据增强 图像 学习 归一化操作 识别和分类 尺寸图像 分类结果 时间成本 算法 输出 | ||
本发明涉及一种基于神经网络和迁移学习的水果图像分类方法及装置,该方法包括:将待分类的图像进行预处理,经预处理后再结合SMOTE算法进行数据增强;将数据增强后的图像的像素点进行BN批量归一化操作,使所述像素点符合正态分布;将所述正态分布的像素点输入基于神经网络和迁移学习的水果图像分类模型,输出所述图像的分类结果。该方法可解决对输入的任意尺寸图像进行分类,该方法依赖基于神经网络和迁移学习的水果图像分类模型,提高识别和分类效率,降低大量时间成本,可靠性高。
技术领域
本发明涉及深度学习领域,特别涉及一种基于神经网络和迁移学习的水果图像分类方法及装置。
背景技术
目前卷积神经网络被广泛用于图像分析的应用场景当中,通过给定数据集上训练模型来完成特定任务,比如分类、检测、识别等。深度学习是图像分析研究中的一个新的领域,其目的在于模拟人脑进行自主学习。深度学习是一种数据驱动型模型,能够模拟人脑视觉机理自动地学习到数据各个层次的抽象特征,从而更好地反映数据的本质特征。随着图像库的不断增大,复杂度不断增高,单机的提取RGB图像特征已经远远不能满足需求,使用数据并行处理无疑是一个好的解决方案。
传统图像分类算法主要有两种,一种是采用sift算法提取特征、进行分类;另一种是,采用神经网络全连接方式和反向传播算法(BP)的方式,利用高斯分布或随机初始值的方法,通过迭代的方式计算当前网络的输出的得分值,然后根据当前预测标签和实际标签之间得分值的差去不断调整前面各层之间的参数,直到整个模型的参数权重w和偏置b收敛。传统的sift算法,误差较大,且需结合大量及繁琐的图像预处理。传统的BP算法,存在着梯度弥散和爆炸问题、图像训练样本不足以及局部最优等问题。与此同时,由于互联网中海量无标签RGB图像呈爆发式增长,BP算法已不能满足日前海量无标签RGB图像分类的需求。
发明内容
有鉴于此,本发明提供一种基于神经网络和迁移学习的水果图像分类方法,可解决对输入的任意尺寸图像进行分类,该方法依赖基于神经网络和迁移学习的水果图像分类模型,提高识别和分类效率,降低大量时间成本,可靠性高。
为了解决上述技术问题,第一方面,本发明实施例提供一种基于神经网络和迁移学习的水果图像分类方法,包括:
将待分类的图像进行预处理,经预处理后再结合SMOTE算法进行数据增强;
将数据增强后的图像的像素点进行BN批量归一化操作,使所述像素点符合正态分布;
将所述正态分布的像素点输入基于神经网络和迁移学习的水果图像分类模型,输出所述图像的分类结果。
在一个实施例中,将待分类的图像进行预处理,包括:
将待分类的图像处理尺寸为299*299像素的图像。
在一个实施例中,所述数据增强的方式包括以一种或多种:
缩放:将图像尺寸缩放80~120%,数据增加至2倍;
镜像翻转:将原始图像进行垂直和水平反转,将图像数据扩充2倍;
高斯噪声:将原始图像中添加一些高斯噪声,将图像数据扩充2倍;
颜色抖动:增强或减弱原始图像对比度,将图像数据扩充2倍;
旋转图片:对原始图像进行旋转45度,将图像数据扩充2倍。
在一个实施例中,所述结合SMOTE算法进行数据增强,公式如下:
式中:特征向量xi,i∈{1,......,T},T个样本,i为样本编号,ζ为0~1之间的随机数。
在一个实施例中,所述基于神经网络和迁移学习的水果图像分类模型由下述步骤训练生成,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南农业大学,未经华南农业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811120209.6/2.html,转载请声明来源钻瓜专利网。