[发明专利]图像的多标签分割方法、装置、计算机设备及存储介质在审
申请号: | 202211601112.3 | 申请日: | 2022-12-14 |
公开(公告)号: | CN115661465A | 公开(公告)日: | 2023-01-31 |
发明(设计)人: | 王楠;王远;李志权;周尧;刘枢;吕江波;沈小勇 | 申请(专利权)人: | 深圳思谋信息科技有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/40;G06V10/75;G06V10/764;G06V10/774;G06F16/53;G06F16/55 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 谢曲曲 |
地址: | 518051 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 标签 分割 方法 装置 计算机 设备 存储 介质 | ||
1.一种图像的多标签分割方法,其特征在于,包括:
确定从目标图像中提取的初始图像特征;
将所述初始图像特征输入注意力网络进行处理,得到所述注意力网络输出的多个查询表征向量;每个所述查询表征向量用于表征所述注意力网络学习提取的同一类图像特征;
基于各所述查询表征向量和所述初始图像特征进行掩膜预测,得到所述目标图像对应的多个预测掩膜;所述多个预测掩膜与所述多个查询表征向量数量匹配;
根据所述多个查询表征向量进行分类预测,得到所述多个预测掩膜对应的多类别概率分布;
根据所述多类别概率分布,确定所述多个预测掩膜的掩膜分类结果。
2.根据权利要求1所述的方法,其特征在于,所述根据所述多个查询表征向量进行分类预测,得到所述多个预测掩膜对应的多类别概率分布之前,所述方法还包括:
通过线性变换层,对所述多个查询表征向量进行特征维度变换,得到多个维度变换后的查询表征向量;
所述根据所述多个查询表征向量进行分类预测,得到所述多个预测掩膜对应的多类别概率分布,包括:
通过线性分类器,对所述多个维度变换后的查询表征向量进行多维度的分类预测,得到所述多个预测掩膜对应的多类别概率分布。
3.根据权利要求2所述的方法,其特征在于,所述基于各所述查询表征向量和所述初始图像特征进行掩膜预测,得到所述目标图像对应的多个预测掩膜,包括:
对所述初始图像特征进行多层上采样处理,得到目标图像特征;所述目标图像特征相较于所述初始图像特征具有更丰富的细节信息;
根据各所述维度变换后的查询表征向量和所述目标图像特征进行掩膜预测,得到所述目标图像对应的多个预测掩膜。
4.根据权利要求1所述的方法,其特征在于,所述根据所述多个查询表征向量进行分类预测,得到所述多个预测掩膜对应的多类别概率分布,包括:
根据所述多个查询表征向量进行多维度的分类预测,得到所述多个预测掩膜对应的初始多类别概率分布;所述初始多类别概率分布包括空类别的概率分布;
从所述初始多类别概率分布中去除所述空类别的概率分布,得到所述多个预测掩膜对应的多类别概率分布。
5.根据权利要求1所述的方法,其特征在于,所述掩膜分类结果是将所述目标图像作为图像的多标签分割模型的输入得到的输出结果;所述确定从目标图像中提取的初始图像特征之前,所述方法还包括:
在每轮迭代训练中,基于样本图像对应的多个样本预测掩膜以及所述多个样本预测掩膜对应的多类别概率分布进行二分图匹配,确定各所述样本预测掩膜对应的标签掩膜和标签类别;
基于所述样本图像对应的多类别概率分布和各所述样本预测掩膜对应的标签类别之间的差异,生成分类预测损失值;
基于各所述样本预测掩膜和相应的标签掩膜之间的差异,生成掩膜预测损失值;
朝着所述掩膜预测损失值和所述分类预测损失值变小的方向对待训练的图像的多标签分割模型进行训练,直至达到训练停止条件,得到已训练的图像的多标签分割模型。
6.根据权利要求1所述的方法,其特征在于,所述目标图像对应的类别包括多个缺陷类别和多个面类别;所述缺陷类别下的像素点和所述面类别下的像素点存在重叠的情况;所述根据所述多个查询表征向量进行分类预测,得到所述多个预测掩膜对应的多类别概率分布,包括:
根据所述多个查询表征向量进行面类别预测以及缺陷类别预测,得到所述多个预测掩膜对应的多类别概率分布;所述多个预测掩膜对应的多类别概率分布包括每个查询表征向量对应各个类别的概率。
7.根据权利要求1至6任意一项所述的方法,其特征在于,所述掩膜分类结果包括不同分类维度的掩膜类别下的掩膜;所述方法还包括:
根据所述掩膜分类结果,从所述多个预测掩膜中确定各个分类维度的掩膜类别下的掩膜,得到各个分类维度对应的至少一待合并掩膜;
分别对各个分类维度对应的至少一待合并掩膜进行合并处理,得到各个分类维度对应的掩膜合并结果;所述掩膜合并结果用于指示同一分类维度的掩膜类别的分布情况。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思谋信息科技有限公司,未经深圳思谋信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211601112.3/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序