[发明专利]图像分割方法和图像处理装置在审
申请号: | 201910157603.5 | 申请日: | 2019-03-01 |
公开(公告)号: | CN110033003A | 公开(公告)日: | 2019-07-19 |
发明(设计)人: | 田值;贺通;沈春华;颜友亮;许松岑;周一韧;吴小飞;刘健庄 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;熊永强 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征图 分辨率 目标特征 输入图像 图像分割 变换矩阵 处理需求 上采样 参考 人工智能领域 图像处理装置 低分辨率 目标处理 目标图像 内存占用 特征提取 有效减少 融合 计算量 下采样 申请 | ||
本申请公开了人工智能领域的一种图像分割方法,该方法包括:获得输入图像和处理需求;对所述输入图像进行多层次的特征提取,得到多个特征图;对所述多个特征图进行下采样,得到多个具有参考分辨率的特征图;所述参考分辨率低于所述输入图像的分辨率;对所述多个具有参考分辨率的特征图进行融合,得到至少一个特征图组;利用变换矩阵W对所述特征图组进行上采样,得到目标特征图组;根据所述处理需求,对所述目标特征图组进行目标处理,得到目标图像。本申请中,使用变换矩阵对较低分辨率的特征图融合得到的特征图组进行上采样得到目标特征图组,能够有效减少内存占用以及计算量,图像分割的精度较高。
技术领域
本申请涉及计算机视觉领域,尤其涉及一种图像分割方法和图像处理装置。
背景技术
计算机视觉是各个应用领域,如制造业、检验、文档分析、医疗诊断和军事等领域中各种智能系统中不可分割的一部分,它是一门关于如何运用照相机/摄像机和计算机来获取我们所需的,被拍摄对象的数据与信息的学问。形象地说,就是给计算机安装上眼睛(照相机/摄像机)和大脑(算法)用来代替人眼对目标进行识别、跟踪和测量等,从而使计算机能够感知环境。因为感知可以看作是从感官信号中提取信息,所以计算机视觉也可以看作是研究如何使人工系统从图像或多维数据中“感知”的科学。总的来说,计算机视觉就是用各种成像系统代替视觉器官获取输入图像,再由计算机来代替大脑对这些输入图像完成处理和解释。计算机视觉的最终研究目标就是使计算机能像人那样通过视觉观察和理解世界,具有自主适应环境的能力。
计算机视觉技术中关于图像理解的重要一环是图像语义分割(semanticsegmentation)。越来越多的应用场景需要采用精确且高效的图像语义分割技术,例如拍照、视频播放、自动驾驶、室内导航、甚至虚拟现实与增强现实等应用场景。图像语义分割是将输入图像中需要处理的部分精确地分割出来,进而对分割出的不同部分执行相应的处理。举例来说,用户可以利用移动终端拍摄图像,然后将拍摄的图像中的人像区域自动分割出来,以便于添加特效,例如调整景深、换背景、仅保留人像区域的颜色、对人像区域之外的图像区域进行虚化等。
目前,利用卷积神经网络(convolutional neuron network,CNN)来处理图像语义分割任务是业界比较普遍的方案。在该方案中,利用CNN先对输入图像进行编码(下采样),再进行解码(上采样)和融合操作,得到最终的图像分割结果。然而,在该方案中,需要使用分辨率较高的特征图进行融合,计算量高、内存开销大。分辨率越高的特征图包含的参数越多。因此,需要研究计算量较少以及内存开销较少的图像语义分割方案。
发明内容
本申请实施例提供了一种图像分割方法和图像处理装置,对高层特征图进行信息融合,可以提高分割精度提升,并减少计算量和内存开销。
第一方面,本申请实施例提供了一种图像分割方法,该方法包括:获得输入图像和处理需求,所述处理需求用于指示对所述输入图像进行图像分割得到的目标特征图组进行目标处理;对所述输入图像进行多层次的特征提取,得到多个特征图;对所述多个特征图进行下采样,得到多个具有参考分辨率的特征图;所述参考分辨率低于所述输入图像的分辨率;对所述多个具有参考分辨率的特征图进行融合,得到至少一个特征图组;利用变换矩阵W对所述特征图组进行上采样,得到所述目标特征图组,所述目标特征图组和所述输入图像具有相同分辨率;其中,所述变换矩阵W是通过对图像分割任务的训练数据建模得到;所述变换矩阵W的其中一个维度与所述特征组的通道数相同;根据所述处理需求,对所述目标特征图组进行所述目标处理,得到目标图像。
本申请实施例中,使用变换矩阵对较低分辨率的特征图融合得到的特征图组进行上采样得到目标特征图组,能够有效减少内存占用以及计算量,图像分割的精度较高。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910157603.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:基于多任务级联卷积神经网络的车牌检测方法
- 下一篇:一种粘连字符的识别方法