[发明专利]基于卷积网络的图像分割方法在审
申请号: | 202010436462.3 | 申请日: | 2020-05-21 |
公开(公告)号: | CN111612008A | 公开(公告)日: | 2020-09-01 |
发明(设计)人: | 陈虹;连博博 | 申请(专利权)人: | 苏州大学 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04 |
代理公司: | 苏州市中南伟业知识产权代理事务所(普通合伙) 32257 | 代理人: | 郭磊 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 卷积 网络 图像 分割 方法 | ||
1.一种基于卷积网络的图像分割方法,其特征在于,包括:
步骤1:数据预处理
使用Cityscapes图像数据集,在训练中只使用其中的11个类别,通过计算得到,该11个类别的像素占比已经超过总像素个数的90%以上,分别为路(Road)、人行道(Sidewalk)、建筑(Building)、植被(Vegetation)、天空(Sky)、地形(Terrain)、人(Person)、轿车(Car)、自行车(Bicycle)、杆(Pole)、巴士(Bus);同时对训练集图像进行左右翻折扩增数据集,获得5950张图片,之后缩放图像大小为512×1024用于网络的训练;
步骤2:卷积网络模型的设计
所述卷积网络称为LBNet网络,主要基于ENet网络进行改进;
步骤3:模型训练与验证
步骤3.1、将步骤1中预处理后的数据分为训练集、验证集和测试集,并将训练集作为卷积网络的输入,训练网络模型参数;
步骤3.2、LBNet网络的验证度量指标使用像素分割精度MPA(Mean Pixel Accuracy)和平均交并比MIoU(Mean Intersection over Union),分别定义为:
其中k+1为分割的总类别数,xij表示类i像素被预测为类j像素的总数目;
步骤3.3、将训练好的网络模型在准备好的测试集上进行模型的验证,并分别统计像素分割精度MPA和平均交并比MIou;
步骤4:模型优化与改进处理
根据步骤3中在测试集上的度量结果,不断调整模型的超参数,实现对步骤2建立的卷积网络模型进行参数优化;
步骤5:模型使用
根据步骤4得到的最终优化好的模型进行测试使用。
2.如权利要求1所述的基于卷积网络的图像分割方法,其特征在于,具体改进策略如下:
步骤2.1、对于中间层中的残差块,ENet使用加法的融合策略Fi=Sum(Xi,Yi)将特征图进行融合,该发明中的卷积网络将上采样阶段的残差块结构,全部改为最大值融合策略,即:Fi=Max(Xi,Yi);
步骤2.2、为了减少采样过程中的图像细节丢失问题,网络结构共使用三次下采样操作,同时在上采样阶段使用反卷积层替换ENet网络解码过程中的所有上采样层,并使用跳跃连接结构,将下采样阶段与上采样过程中同分辨率大小的特征图进行融合;
步骤2.3、对ENet网络结构中存在的一些合并层(Concat),在其后面加一层卷积层,设定卷积核的大小为(1×1),卷积核的数目为合并层的特征图通道数,其目的是对合并后的特征图进行线性组合,更好的提取图像特征;
步骤2.4、为了增加感受野,在下采样过程的卷积模块中多次使用扩张卷积,扩张率分别为2、4、8、16,同时加入金字塔结构的融合策略,分别将扩张率为2和4的卷积模块的输出进行融合,得到的结果再与扩张率为8的卷积模块融合,最后与扩张率为16的卷积模块融合;
步骤2.5、修改ENet网络中使用的卷积模块,由两路卷积分别捕捉不同尺度感受野信息,并使用残差结构进行融合,进一步提高网络的分割精度。
3.如权利要求1所述的基于卷积网络的图像分割方法,其特征在于,训练参数设定如下:初始学习率设置成0.001,总共迭代次数为75000次,学习率衰减规则为:分别在迭代次数是18750、37500和56250时降低学习率为当前学习率的0.1,权重衰减率为0.0002,使用Softmax损失函数,并且通过Adam优化器优化损失函数,参数为:β1=0.9,β2=0.99,其他参数默认。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010436462.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序