[发明专利]一种用于工业零件图像的快速分类方法有效
申请号: | 201910815195.8 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110633738B | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 郑小青;陈杰;郑松;王洪成;孔亚广 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州君度专利代理事务所(特殊普通合伙) 33240 | 代理人: | 杨舟涛 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种用于工业零件图像的快速分类方法,该方法包括:获取工业零件,对工业零件图像进行标记,预处理和数据增强;将工业零件图像划分为训练集和验证集;设计一种在残差网络和轻量化网络上进行的改进的快速卷积神经网络模型,得到的训练样本输入卷积神经网络模型中训练网络权重、偏置参数,生成分类器。使用验证样本验证模型分类器;确定最佳超参数,在此最优超参数下迭代完成得到最优的卷积神经网络模型;对将要分类的工业零件图像进行预处理,输入到卷积神经网络模型中;输出卷积神经网络模型的预测矩阵中每一行最大值的索引值,根据索引值得到对应工业零件图像的分类标签,完成分类。本发明增强了鲁棒性,提高了正确率和速度。 | ||
搜索关键词: | 一种 用于 工业 零件 图像 快速 分类 方法 | ||
【主权项】:
1.一种用于工业零件图像的快速分类方法,其特征在于,包括以下步骤:/n步骤1:选取多种工业零件,获取目标零件图像,对工业零件图像进行标记和预处理,将工业零件图像归一化处理,并将归一化处理过的工业零件图像调整为224×224×3的统一格式;采取FD翻转降噪的数据增强方式;/n步骤2:将步骤1中的工业零件图像按照8:2划分为训练集和验证集;/n步骤3:设计一种卷积神经网络模型/n该卷积神经网络模型是在残差网络和轻量化网络上进行的改进;引入了轻量化模型的结构且对标准的残差网络进行了加深与加宽;网络模型主体结构包含第一卷积组块CONV1、第二卷积组块CONV2和第三卷积组块CONV3以及第四卷积组块CONV4;网络输入图像大小为224×224×3;/n该卷积神经网络模型第一层是64个感受野大小为7×7的卷积层,步长为2,边缘填充为2,输出为64个通道、大小为112×112的特征;第二层采用重叠的最大池化层,即感受野大小为3×3,步长为2,边缘填充为1,输出为64个通道,图像大小为56×56的特征;/n然后经过第一卷积组块,第一卷积组块是一个有三个模块连接而成的,由1个单元B和3个单元A自上而下连接构成,输出为96通道,图像大小为56×56的特征;具体为:单元A,当卷积步长为1,先将输入特征按通道一分为二,化成两个分支来代替原先的分组卷积结构,并且每个分支中的卷积层都是保持输入输出通道相同;其中一个分支不采取任何操作,另一个分支是一个包含3层的残差单元;另一个分支首先是1×1卷积层,然后是3×3的深度卷积层,紧接着是1×1卷积层,最后两个分支通过shortcut连接;单元B,当卷积步长为2时,对通道数进行翻倍;一个分支包含两个连续卷积,先是3×3的深度卷积,然后是1×1的卷积;另一个分支包含3个连续的卷积,先是1×1卷积,然后是3×3的深度卷积,最后是1×1的卷积,并且输入和输出通道相同,最后两个分支通过shortcut连接;/n经过第二卷积组块,第二卷积组块包括两个残差结构,即经过四次卷积;/n第一次卷积是192个感受野大小为3×3的卷积层,步长为2,边缘填充为2,输出为192个通道、大小为28×28的特征;第二次卷积是192个感受野大小为3×3的卷积层,步长为1,边缘填充为2,输出为192个通道、大小为28×28的特征;第三次和第四次卷积操作同第二次,最后输出为192个通道、大小为28×28的特征;/n经过第三卷积组块,第三卷积组块包括两个残差结构,同样是经过四次卷积;第一次卷积是384个感受野大小为3×3的卷积层,步长为2,边缘填充为2,输出为384个通道、大小为14×14的特征;第二次卷积是384个感受野大小为3×3的卷积层,步长为1,边缘填充为2,输出为384个通道、大小为14×14的特征;第三次和第四次卷积操作同第二次卷积,最后输出为384个通道、大小为14×14的特征;/n经过第四卷积组块,第四卷积组块包括三个残差结构,即经过六次卷积;第一次卷积是768个感受野大小为3×3的卷积层,步长为2,边缘填充为2,输出为768个通道、大小为7×7的特征;第二次卷积是768个感受野大小为3×3的卷积层,步长为1,边缘填充为2,输出为384个通道、大小为7×7的特征;随后的四次卷积操作同第二次,最后输出为768个通道、大小为7×7的特征;/n随后是平均池化层,感受野大小为7×7,步长为1,输出为768个通道,图像大小为1×1的特征;/n最后是全连接层和softmax分类层,用于计算输出属于每一类的概率;/n其中为了减轻模型的过拟合,每次进行卷积操作前都使用dropout和batchnormalizaton;/n步骤4:将经步骤2得到的训练样本输入到步骤3设计的卷积神经网络模型中训练网络权重、偏置参数,生成分类器;同时使用验证样本不断验证模型分类器;采用交叉熵损失函数,设置batch_size为100,从训练样本中每次提取100个样本参与训练;当模型分类器中每迭代一个周期,将验证样本集输入模型分类器中识别准确率;迭代周期数不大于400且连续20个周期内验证集正确率没有得到提高,就提前终止训练;/n步骤5:多次更改卷积神经网络模型的超参数,确定最佳超参数,在此最优超参数下迭代完成得到最优的卷积神经网络模型;/n步骤6:对将要分类的工业零件图像进行预处理,图像的获取方式为实时抓拍,输入到最优的卷积神经网络模型中;/n步骤7:输出卷积神经网络模型的预测矩阵中每一行最大值的索引值,根据索引值得到对应工业零件图像的分类标签,完成分类,等待随后机械臂的操作。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910815195.8/,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序