[发明专利]图像编码和解码的方法、装置、计算机设备及存储介质在审
申请号: | 202211358067.3 | 申请日: | 2022-11-01 |
公开(公告)号: | CN115690241A | 公开(公告)日: | 2023-02-03 |
发明(设计)人: | 王楠;刘枢;吕江波;沈小勇;王远;周震东 | 申请(专利权)人: | 深圳思谋信息科技有限公司 |
主分类号: | G06T9/00 | 分类号: | G06T9/00;G06T7/10;G06T7/00;G06N3/0464;G06N3/084;G06N3/09 |
代理公司: | 北京龙双利达知识产权代理有限公司 11329 | 代理人: | 王君;肖鹂 |
地址: | 518051 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 编码 解码 方法 装置 计算机 设备 存储 介质 | ||
本申请实施例提供了一种图像编码和解码的方法、装置、计算机设备及存储介质,涉及图像处理技术领域。该方法包括:对获取的第一图像进行预处理,得到第二图像,第一图像为待检测图像;将第二图像输入改进骨干网络中,基于反向像素重组的方式,对第二图像进行下采样得到第一特征图,并基于交叉型卷积核,对第一特征图进行特征提取得到第二特征图,第二特征图包括第一图像的细节特征;通过跨层连接,向图像解码器发送第二特征图,以使得图像解码器对第二特征图进行上采样,恢复出分割图像,分割图像为包括第一图像的细节特征且与第一图像分辨率相同的图像。该方法较为精确地分割出小目标缺陷,极大地改善缺陷漏杀率,显著提升缺陷检测性能。
技术领域
本申请涉及图像处理技术领域,并且更具体地,涉及一种图像编码和解码的方法、装置、计算机设备及存储介质。
背景技术
随着深度学习技术的快速发展,深度学习在图像分类,语义分割和目标检测都取得了长足的进步,深度学习技术也应用到各个领域。但是在工业缺陷检测应用场景中,经常需要在分辨率为两千万像素以上的图像中,分割出最短拓扑宽度只有三、四个像素左右的小目标缺陷。而在图像分割的过程中,通常采用基于深度神经网络的图像分割方法,其骨干网络中都采用了池化层或带步长卷积以逐步减少特征图的分辨率。随着网络阶段的深入,骨干网络提取到的特征更加抽象、丰富,但是精细的空间元素信息也在逐渐损失,这也致使无法恢复出精细的分割结果。因此,在一些应用场景下,基于深度神经网络的图像分割方法检出的准确率和召回率远低于人工水平,并不能实际部署于产线进行缺陷检测。
因此,基于深度神经网络的图像分割方法缺陷漏杀率较高,缺陷检测性能差的问题,是一项亟需解决的技术问题。
发明内容
本申请实施例提供一种图像编码和解码的方法、装置、计算机设备及存储介质,以解决现有的基于深度神经网络的图像分割方法缺陷漏杀率较高,缺陷检测性能差的问题。
第一方面,提供了一种图像编码的方法,应用于图像编码器,该方法包括:
对获取的第一图像进行预处理,得到第二图像,该第一图像为待检测图像;
将第二图像输入改进骨干网络中,基于反向像素重组的方式,对第二图像进行下采样得到第一特征图,并基于交叉型卷积核,对第一特征图进行特征提取得到第二特征图,第二特征图包括第一图像的细节特征;
通过跨层连接,向图像解码器发送第二特征图,以使得图像解码器对第二特征图进行上采样,恢复出分割图像,该分割图像为包括第一图像的细节特征且与第一图像分辨率相同的图像。
应理解,上述图像分割的过程可以包括图像编码和图像解码两部分。
示例地,上述第一图像可以通过计算机设备拍摄得到,该计算机设备可以为具有高分辨率摄像头的照相机、电脑等。
示例地,上述改进骨干网络可以是一种改进的高分辨率网络(high-resolutionnet,HRNet),并且保留了现有的普通HRNet内部结构中保持的一条具有高分辨率特征图的支路,该支路能够较好保留小目标缺陷的特征,以提升小目标缺陷的检出率。
应理解,图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。因此,上述图像特征提取的操作即为一种图像分割的方式。
基于上述技术方案,通过反向像素重组的方式实现信息无损的下采样,以充分保留小目标的空间位置信息;通过交叉型卷积核可以更好地适配工业场景中容易出现的细长划痕的拓扑结构,以更好地提取其边缘特征;并通过跨越连接的方式与解码器连接,以使得多尺度的细节特征可以直接传递并融合到解码结果中。在兼顾检测效率的同时,较为精确地分割出小目标缺陷,减少缺陷漏杀率,提升缺陷检测性能。
结合第一方面,在第一方面的某些实现方式中,上述基于反向像素重组的方式,对第二图像进行下采样得到第一特征图,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳思谋信息科技有限公司,未经深圳思谋信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211358067.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序