[发明专利]图像语义分割模型生成方法、装置、设备及存储介质有效
申请号: | 201910489560.0 | 申请日: | 2019-06-05 |
公开(公告)号: | CN110188765B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 王婷婷 | 申请(专利权)人: | 京东方科技集团股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 北京志霖恒远知识产权代理事务所(普通合伙) 11435 | 代理人: | 郭栋梁 |
地址: | 100015 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 语义 分割 模型 生成 方法 装置 设备 存储 介质 | ||
本申请公开了图像语义分割模型生成方法、装置、设备及存储介质。该方法包括:获取图像样本集;利用图像样本集训练图像语义分割模型,图像语义分割模型包括特征图提取部分和特征图分析部分,特征图提取部分包括多个级联的空洞卷积处理的残差模块,特征图分析部分是基于注意力机制、像素相关性机制以及多尺度信息来构建的。根据本申请实施例的技术方案,有效地利用注意力机制学习空间位置和通道维度上的依赖关系,增强特征表达能力,并利用像素相关性机制使得分割结果更加准确,同时还利用多个尺度特征信息学习全局场景,以提高像素点分类的准确性。
技术领域
本申请一般涉及数据处理技术领域,尤其涉及图像语义分割模型生成方法、装置、设备及存储介质。
背景技术
图像语义分割是图像理解的基础技术,其在自动驾驶系统、无人机以及穿戴式设备中的应用举足轻重。通常图像是由许多像素(Pixel)组成,而“语义分割”就是将像素按照图像中表达语义含义的不同进行分组(Grouping)/分割(Segmentation)。
深度学习在计算机视觉、图像视频分析领域的应用取得了巨大成功。使用深度学习进行图像分割,可以理解为对图像中每个像素进行分类,即对输入图像中出现的物体进行分类并定位不同的类别的物体的位置。但是,基于深度学习进行图像分割仍然存在匹配关系错误、模糊分类、无视小目标物体等缺点。
发明内容
鉴于现有技术中的上述缺陷或不足,期望提供一种图像语义分割模型生成方法、装置、设备及存储介质,来提升图像分割的准确率。
第一方面,本申请实施例提供了一种图像语义分割模型生成方法,该方法包括:
获取图像样本集;
利用图像样本集训练图像语义分割模型,图像语义分割模型包括特征图提取部分和特征图分析部分,特征图提取部分包括多个级联的残差模块和至少一个空洞卷积模块,特征图分析部分是基于注意力机制、像素相关性机制以及多尺度信息来构建的。
第二方面,本申请实施例提供了一种图像语义分割模型生成装置,该装置包括:
获取单元,用于获取图像样本集;
训练单元,用于利用图像样本集训练图像语义分割模型,图像语义分割模型包括特征图提取部分和特征图分析部分,特征图提取部分包括多个级联的残差模块和至少一个空洞卷积模块,特征图分析部分是基于注意力机制、像素相关性机制以及多尺度信息来构建的。
第三方面,本申请实施例提供了一种电子设备,包括存储器、处理器以及存储在存储器上并可在处理器上运行的计算机程序,该处理器执行该程序时实现如本申请实施例描述的方法。
第四方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序用于:
该计算机程序被处理器执行时实现如本申请实施例描述的方法。
本申请实施例提供的图像语义分割模型生成方案,通过结合特征图提取部分和特征图分析部分来构建图像语义分割模型,其中特征提取部分包括多个级联的空洞卷积处理的残差模块,可以在不损失信息的情况下增大感受野,特征图分析部分基于注意力机制、像素相关性机制以及多尺度信息来构建,有效地利用注意力机制学习空间位置和通道维度上的依赖关系,增强特征表达能力,并利用像素相关性机制使得分割结果更加准确。
进一步地,通过并行地利用双重注意力子模型和金字塔池化子模型以及与之分别级联的条件随机场子模型构建的图像语义分割模型,可以利用不同尺度上下文信息学习全局场景的特征。
进一步地,通过并行地利用双重注意力子模型和金字塔池化子模型以及与之分别级联的第一条件随机场子模型和第二条件随机场子模型,以及将特征图提取部分的局部信息输入到第三条件随机场子模型,然后将预测结果进行全局融合,从而提高分割准确性。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东方科技集团股份有限公司,未经京东方科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910489560.0/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序