[发明专利]一种基于深度学习的图像分割方法、系统及电子设备在审
申请号: | 201810852143.3 | 申请日: | 2018-07-30 |
公开(公告)号: | CN109118491A | 公开(公告)日: | 2019-01-01 |
发明(设计)人: | 邬晶晶;张涌;许强 | 申请(专利权)人: | 深圳先进技术研究院 |
主分类号: | G06T7/10 | 分类号: | G06T7/10;G06N3/04 |
代理公司: | 深圳市科进知识产权代理事务所(普通合伙) 44316 | 代理人: | 曹卫良 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 图像分割 电子设备 分割结果 网络模型 上采样 堆叠 卷积神经网络 图像分割技术 归一化处理 输出图像 输入图像 图像输入 像素分类 语义信息 原始图像 归一化 学习 申请 收敛 全局 网络 | ||
本申请属于图像分割技术领域,特别涉及一种基于深度学习的图像分割方法、系统及电子设备。所述基于深度学习的图像分割方法包括:步骤a:对原始图像进行归一化处理;步骤b:将所述归一化后的图像输入ResUNet网络模型,所述ResUNet网络模型提取输入图像中包含全局语义信息的特征图,并对所述特征图进行上采样及特征图堆叠处理,得到最终的特征图;步骤c:对所述上采样及堆叠处理后的特征图进行逐像素分类,并输出图像分割结果。本申请解决了卷积神经网络中常见的梯度消失问题,也能让网络更加容易训练,收敛到一个更好的分割结果。
技术领域
本申请属于图像分割技术领域,特别涉及一种基于深度学习的图像分割方法、系统及电子设备。
背景技术
图像工程主要分为三个层次:图像处理、图像分析和图像理解。图像分割的目标是将图像中的每个像素进行分类,即利用图像目标物体的像素和周围像素之间的不连续性或者目标内部的相似性把图片切割成多个小区域的分割块。图像分割是图像工程中最基础也是最难的一个部分,是联系图像处理和图像分析之间的重要桥梁。图像分割方式主要包括二值分割、语义分割以及实例分割。在传统的图像处理算法里面,大多都是研究二值分割,即是把图片的像素分成前景和背景两类。传统的分割算法主要包括边缘检测(如canny)、阈值分割(如OTSU)、区域生长、聚类(如k-means)和图模型(如grabcut)等。
现在数据越来越多,很多大型的分割数据库都公开了(PASCAL VOC,Cityscape,Places,DAVIS等),计算机的计算能力进一步提升,GPU在处理图像计算的能力被重视起来,效果最好的是基于深度学习的一些方法,例如FCN(Fully Convolutional Networks,全卷积网络)、Deeplab(语义分割网络)、U-Net(Convolutional Networks for BiomedicalImage Segmentation,此网络用于分割细胞图像)、DRN(Deep Residual Network,深度残差网络)、PSPNet(Pyramid Scene Parsing Network,语义分割网络)等。深度学习相对于传统的方法的优点是可以自动提取到图像的特征,无论是语义分割还是实例分割都可以建立端到端的网络结构,以及能够一定程度上提取到图片中的语义信息,而且因为训练的图片变多了,训练得到的模型也具有更好的泛化能力。
其中文章[Philipp Fischer,ThomasBrox.U-Net:Convolutional Networks forBiomedical Image Segmentation.Medical Image Computing and Computer-AssistedIntervention(MICCAI).2015.]中提出的U-Net网络结构把图像分割网络分成两个部分,U-Net网络结构如图1所示,由一条收缩路径(左侧)和一条扩展路径(右侧)组成。收缩路径遵循卷积网络的典型体系结构,它由2次3*3无填补卷积(unpaddedconvolutions)和最大池化重复应用组成。每一次下采样都将通道数量加倍,在扩展路径中的每一步都对特征图进行上采样,然后进行2*2卷积将特征通道数减小一半,与收缩路径中相应裁剪的特征值图堆叠。输入图片从左到右依次经过逐层的卷积和池化,提取到的特征具有更加抽象的语义信息,下采样的过程能够一步一步的获取到整张图片的全局语义信息,但是特征图的分辨率却一直在降低,这也导致越右边的特征图虽然有更抽象的语义信息但是也丢失了很多空间细节信息,这样会导致分割结果边界不清晰。虽然上采样本身能够恢复一些空间细节信息。但是这是远远不够的,U-Net就是在上采样的过程中也加入一些左边有着更高分辨率的特征图(更高分辨率往往意味着更多空间细节信息)。文章采取直接复制过来再裁剪到与上采样图片一样大小,因为随着卷积次数增多,提取的特征也更加有效,更加抽象,上采样的图片是经历多次卷积后比较高效和抽象的图片,然后把特征图与左侧不怎么抽象但分辨率高的特征图片进行堆叠,让上采样过后的特征图里不光有着抽象的语义信息,也有着更多的空间细节信息。
综上所述,现有的图像分割方法存在的不足在于:
1)、传统图像分割算法
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳先进技术研究院,未经深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810852143.3/2.html,转载请声明来源钻瓜专利网。