[发明专利]图像的多标签分割方法、装置、计算机设备及存储介质在审
申请号: | 202211601112.3 | 申请日: | 2022-12-14 |
公开(公告)号: | CN115661465A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 王楠;王远;李志权;周尧;刘枢;吕江波;沈小勇 | 申请(专利权)人: | 深圳思谋信息科技有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/40;G06V10/75;G06V10/764;G06V10/774;G06F16/53;G06F16/55 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 518051 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标签 分割 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种图像的多标签分割方法、装置、计算机设备及存储介质。方法包括:确定从目标图像中提取的初始图像特征;将初始图像特征输入注意力网络进行处理,得到注意力网络输出的多个查询表征向量;每个查询表征向量用于表征注意力网络学习提取的同一类图像特征;基于各查询表征向量和初始图像特征进行掩膜预测,得到目标图像对应的多个预测掩膜;多个预测掩膜与多个查询表征向量数量匹配;根据多个查询表征向量进行分类预测,得到多个预测掩膜对应的多类别概率分布;根据多类别概率分布,确定多个预测掩膜的掩膜分类结果。采用本方法,能够提高图像多标签分割的效率。
技术领域
本申请涉及图像处理技术领域,特别是涉及一种图像的多标签分割方法、装置、计算机设备及存储介质。
背景技术
随着图像处理技术的发展,出现了语义分割技术。语义分割问题被视为像素级别的分类任务,并且受到广泛关注的是多分类任务,即像素的单标签问题。语义分割模型在给定输入图像的情况下输出各个像素对应的单个类别标签。
传统技术中,语义分割模型只对像素类别互斥的单标签任务有效,即,只使用一个语义分割模型无法处理标签重叠的问题。因此,存在几种重叠的标签,就需要相应数量的语义分割模型,这会造成推理时间和计算开销显著增加,导致效率低的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种图像的多标签分割方法、装置、计算机设备、计算机可读存储介质以及计算机程序产品,能够提高图像多标签分割的效率。
第一方面,本申请提供了一种图像的多标签分割方法,包括:
确定从目标图像中提取的初始图像特征;
将初始图像特征输入注意力网络进行处理,得到注意力网络输出的多个查询表征向量;每个查询表征向量用于表征注意力网络学习提取的同一类图像特征;
基于各查询表征向量和初始图像特征进行掩膜预测,得到目标图像对应的多个预测掩膜;多个预测掩膜与多个查询表征向量数量匹配;
根据多个查询表征向量进行分类预测,得到多个预测掩膜对应的多类别概率分布;
根据多类别概率分布,确定多个预测掩膜的掩膜分类结果。
在一些实施例中,根据多个查询表征向量进行分类预测,得到多个预测掩膜对应的多类别概率分布之前,方法还包括:
通过线性变换层,对多个查询表征向量进行特征维度变换,得到多个维度变换后的查询表征向量;
根据多个查询表征向量进行分类预测,得到多个预测掩膜对应的多类别概率分布,包括:
通过线性分类器,对多个维度变换后的查询表征向量进行多维度的分类预测,得到多个预测掩膜对应的多类别概率分布。
在一些实施例中,基于各查询表征向量和初始图像特征进行掩膜预测,得到目标图像对应的多个预测掩膜,包括:
对初始图像特征进行多层上采样处理,得到目标图像特征;目标图像特征相较于初始图像特征具有更丰富的细节信息;
根据各维度变换后的查询表征向量和目标图像特征进行掩膜预测,得到目标图像对应的多个预测掩膜。
在一些实施例中,根据多个查询表征向量进行分类预测,得到多个预测掩膜对应的多类别概率分布,包括:
根据多个查询表征向量进行多维度的分类预测,得到多个预测掩膜对应的初始多类别概率分布;初始多类别概率分布包括空类别的概率分布;
从初始多类别概率分布中去除空类别的概率分布,得到多个预测掩膜对应的多类别概率分布。
在一些实施例中,掩膜分类结果是将目标图像作为图像的多标签分割模型的输入得到的输出结果;确定从目标图像中提取的初始图像特征之前,方法还包括:
在每轮迭代训练中,基于样本图像对应的多个样本预测掩膜以及多个样本预测掩膜对应的多类别概率分布进行二分图匹配,确定各样本预测掩膜对应的标签掩膜和标签类别;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思谋信息科技有限公司,未经深圳思谋信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211601112.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序