[发明专利]一种图像分割方法、装置、存储介质及电子设备在审
申请号: | 202111212703.7 | 申请日: | 2021-10-18 |
公开(公告)号: | CN114022674A | 公开(公告)日: | 2022-02-08 |
发明(设计)人: | 焦洋;马林;揭泽群;罗伟鑫 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/44;G06V10/74;G06V10/80;G06V10/82;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京曼威知识产权代理有限公司 11709 | 代理人: | 方志炜 |
地址: | 100080 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 分割 方法 装置 存储 介质 电子设备 | ||
在本说明书提供的图像分割方法中,预设的图像分割模型获取到待处理图像与文本后,可以分别提取图像特征与文本特征,并根据图像特征与文本特征查询到预设的标准图像中与待处理图像相关的图像,采用该相关图像对待处理图像的图像特征进行增强,得到增强图像特征。增强图像特征在要分割的目标物处的图像特征信息丰富,图像分割模型可以根据该图像特征精准的实现对目标物的分割。在待处理图像中目标物视觉信息较弱而导致待处理图像的图像特征中目标物部分的特征不足时,本说明书中提供的图像分割方法可以有效增强待处理图像中目标物的视觉信息,丰富目标物部分的图像特征,从而避免分割不准确与分割错误的情况,取得更好的分割效果。
技术领域
本说明书涉及图像处理领域,尤其涉及一种图像分割方法、装置、存储介质及电子设备。
背景技术
在图像分割中,以语言为导向的图像分割技术是目前发展最迅速的技术之一,该技术在给定一张图像和对该图像中任意一个目标物的语言描述的情况下,可以根据语言描述确定图像中对应的目标物,并将图像中对应的目标物准确地分割出来,有着广泛的应用前景。但目前,以语言为导向的图像分割任务存在着一个难点:当语言描述所指向的目标物在图像中视觉信息较弱时,会导致分割结果不准确,或是分割错误。
在现有的以语言为导向的图像分割技术中,通常会先利用卷积神经网络(Convolutional Neural Networks,CNN)提取给定图像的图像特征,并利用长短期记忆网络(Long Short-Term Memory,LSTM)/门控循环单元(Gate Recurrent Unit,GRU)提取给定语言描述的文本特征。将提取出的图像特征与文本特征进行跨模态融合后得到多模态特征,并利用多模态特征对图像进行分割。
可以看出,现有技术并不能解决上文中提出的难点。如果给定的语言描述所指向的目标物在图像中出现被遮挡、分辨率过低或是光照不足等情况,导致目标物的图像特征较弱,现有技术很可能会出现分割结果不准确甚至分割错误的情况。
发明内容
本说明书提供一种图像分割方法、装置、存储介质及电子设备,以至少部分的解决现有技术存在的上述问题。
本说明书采用下述技术方案:
本说明书提供了一种图像分割方法,包括:
确定待处理图像以及所述待处理图像对应的文本;
将所述待处理图像与所述文本输入到预设的图像分割模型中,以通过所述模型中的图像特征提取子网提取所述待处理图像的图像特征,通过所述模型中的文本特征提取子网提取文本特征;
根据所述待处理图像的图像特征以及文本特征,在预先存储的各标准图像中,查询与所述待处理图像和所述文本相关的标准图像,作为相关图像;
通过所述图像特征提取子网提取所述相关图像的图像特征;
通过所述模型中的特征融合子网融合所述待处理图像的图像特征和所述相关图像的图像特征,得到增强图像特征;
根据所述增强图像特征,从所述待处理图像中分割出目标物。
可选的,根据所述待处理图像的图像特征以及文本特征,在预先存储的各标准图像中,查询与所述待处理图像和所述文本相关的标准图像,作为相关图像,具体包括:
针对每个标准图像,对比该标准图像所对应的文本与所述待处理图像对应的文本的文本相似度,若所述文本相似度大于指定阈值,则将该标准图像作为待定图像;
针对每个待定图像,对比该待定图像与所述待处理图像的图像相似度;
根据所述待处理图像与每个待定图像的图像相似度,从各待定图像中选择相关图像。
可选的,所述图像特征提取子网包括若干卷积层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111212703.7/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序