[发明专利]基于宽残差金字塔池化网络的图像分割方法及系统有效
申请号: | 201711228818.9 | 申请日: | 2017-11-29 |
公开(公告)号: | CN107945185B | 公开(公告)日: | 2020-02-07 |
发明(设计)人: | 王瑜;朱婷;马泽源 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G06T7/10 | 分类号: | G06T7/10 |
代理公司: | 11201 北京清亦华知识产权代理事务所(普通合伙) | 代理人: | 张润 |
地址: | 100048 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 宽残差 金字塔 网络 图像 分割 方法 系统 | ||
本发明公开了一种基于宽残差金字塔池化网络的图像分割方法及系统,其中,方法步骤包括:输入待分割图像;对待分割图像进行标准化;获取WRN‑PPNet模型;对训练图像进行预处理,并通过数据扩展法增加训练图像的模式和数量,得到训练图像集;根据WRN‑PPNet模型和训练图像集进行模型训练,以生成WRN‑PPNet分割模型;根据待分割图像通过WRN‑PPNet分割模型得到图像分割结果。该方法可以基于WRN‑PPNet全自动地对图像进行分割,实现对目标对象分割的目的,不受待分割图像类别的限制,而且适应性强,模型性能好,从而有效提高图像分割的准确性和便捷性。
技术领域
本发明涉及图像处理和计算机视觉技术领域,特别设计一种基于宽残差金字塔池化网络的图像分割方法及系统。
背景技术
相关技术中,FCN(fully convolutional network,全卷积网络)开启了深度学习做图像语义分割的大门,此后的图像语义分割深度学习模型多是基于FCN做了一些改进。FCN是利用现存的CNNs(convolutional neural networks,卷积网络)做视觉模型,学习分层特征,再将分类网络最后的全连接层改为全卷积层,然后输出特征图,以取代分类得分,最后对这些特征图做反卷积,来产生稠密像素级标记的输出图。这种网络模型实现了用CNNs端到端地解决视觉问题。但是FCN缺少不同的特征感知,不能在具体问题和场景中很好的应用,因为它本身存在的空间不变性,使得它不能考虑上下文信息,不能感知实例等等。针对FCN的种种缺陷,研究者们提出了很多改进方法,大致包括:解码变种、整合上下文信息、条件随机场、膨胀卷积、多尺度聚合、特征融合以及递归神经网络。解码变种的方法中比较典型的是SegNet,它包含了编码器(卷积网络)和解码器(反卷积网络)两部分,相对于普通的全卷积网络,它是通过解码网络实现对低分辨率的特征图的处理;整合上下文信息的方法有PSPNet(pyramid scene parsing network,金字塔场景解析网络),该方法主要是在网络中使用了PPNet模块;此外还有用CRF(conditional random fields,条件随机场)做后期处理,以提高模型捕捉细节的能力;使用膨胀卷积,通过增大卷积核的步伐做卷积,以获得更宽的接受域等等。
然而,上述提到的模型均是针对具体的语义分割问题,在FCN的基础上做的不同程度的改进,并没有哪一种模型能很好的用于解决更多不同的图像语义分割问题,所以用于图像语义分割的深度学习网络模型结构还有很大的探索空间。相关技术中,传统分割方法是提取合适的特征,再根据特征分割,但是这类方法只能提取浅层特征,且操作复杂,适用性不强,难以普及。
发明内容
本发明旨在至少在一定程度上解决相关技术中的技术问题之一。
为此,本发明的一个目的在于提出一种基于宽残差金字塔池化网络的图像分割方法,该方法适用性强,模型性能好,具有鲁棒性,使分割不但更加便捷、有效,而且操作简单且性能更好,从而有效提高图像分割的精准性和便捷性。
本发明的另一个目的在于提出一种基于宽残差金字塔池化网络的图像分割系统。
为达到上述目的,本发明一方面实施例提出了一种基于宽残差金字塔池化网络的图像分割方法,包括以下步骤:输入待分割图像;对所述待分割图像进行标准化,以使所述待分割图像的像素均值为0且方差为1;获取WRN-PPNet(wide ResNet and pyramidpooling network,宽残差金字塔池化网络)模型,其中,所述WRN-PPNet模型包括WRN模块和PPNet模块,且所述WRN模块提取的特征与所述PPNet模块提取的特征相融合;对训练图像进行预处理,以使所述训练图像的像素均值为0且方差为1,且使得分割对象的像素标签为1且其余部分像素标签为0,并通过数据扩展法增加所述训练图像的模式和数量,得到训练图像集;根据所述WRN-PPNet模型和所述训练图像集进行模型训练,以生成WRN-PPNet分割模型;根据所述待分割图像通过所述WRN-PPNet分割模型得到图像分割结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711228818.9/2.html,转载请声明来源钻瓜专利网。