[发明专利]一种基于深度学习的水下图像增强方法在审
申请号: | 202210040116.2 | 申请日: | 2022-01-14 |
公开(公告)号: | CN114529713A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 左琳;徐冯杰;张昌华;刘宇;杨兴;刘斌;胡建;罗茂林 | 申请(专利权)人: | 电子科技大学 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06K9/62;G06N3/04;G06N3/08;G06T5/00;G06T7/90;G06V10/82;G06V10/80 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 611731 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 水下 图像 增强 方法 | ||
本发明公开了一种基于深度学习的水下图像增强方法,属于深度学习和计算机视觉领域。本发明所属方法将输入的水下图像拆分为R、G、B三个颜色通道,再使用多尺度融合注意力模块分别学习不同颜色通道的衰减特征图,然后将不同颜色通道的衰减特征图进行通道堆叠,紧接着使用通道注意力机制提取感兴趣的衰减特征,最后利用1×1的卷积减少特征图输出维度并与输入图像融合,增强输入的水下图像。本发明所属方法可以有效提升水下图像的整体视觉质量,对在衰减光照条件下拍摄的各类场景的水下图像具有很好的鲁棒性,解决了传统水下图像增强方法得到的图像存在颜色校正色差大、图像照度低、噪声高且图像雾化较为严重等图像视觉质量提升不明显问题。
技术领域
本发明属于深度学习和计算机视觉领域,具体涉及一种基于计算机视觉的水下图像增强方法。
背景技术
高质量的水下图像是理解水下信息的前提,对实际的海底探测、水下生物多样性研究、水下环境保护等工程项目和科学研究有着十分重要的影响。然而,受水中杂质、气泡等物理环境的影响,水下图像的质量往往会出现一定的退化。水对光的散射作用导致获取到的水下图像纹理模糊,并存在一定的雾化现象。水对光的吸收作用导致水下图像颜色失真,波长越长的光被吸收的越明显,导致水下图像基本呈现出蓝、绿色调。因此,为了解决上述问题,国内外的研究学者利用计算机视觉技术,对水下图像质量的恢复展开了深入研究。
现有的方法主要是分为两类,一类是基于水下光学成像模型的水下图像增强方法,另一类是通过直接调整图像像素分布的非物理模型图像增强方法。然而,基于物理模型的水下图像增强方法过度依赖于人工设置参数,不具备普适性和泛化性。另一方面,基于非物理模型的水下图像增强方法一般没有考虑到图像的R、G、B通道在水中传输过程中的衰减程度不同,无法很好地应对水下场景复杂、光照强度不均匀和噪声干扰明显的情况。
因此,迫切需要一种既能够改善由于水下场景复杂、光照强度不均匀、噪声干扰严重等因素造成的水下图像质量提升不明显,也能避免水下成像模型的人工参数设置复杂的水下图像增强方法。
发明内容
本发明提供了一种基于深度学习的水下图像增强方法,目的是改善现有技术得到的水下图像照度低、噪声高、分辨率低、雾化严重、对比度不明显和颜色失真等图像整体视觉质量退化问题,避免进一步影响目标物体的识别、追踪和检测。本发明通过深度卷积网络学习水下图像退化的底层特征,使网络模型能够适应复杂的水下场景和光照变化,并减少了增强过程中人工操作的干预。
本发明所提出的技术问题是这样解决的:
一种基于深度学习的水下图像增强方法,包括以下步骤:
步骤1,通道拆分:将输入的原始图像拆分为R、G、B三个通道矩阵,并分别将三个通道矩阵的像素值归一化到相同的数据分布;
步骤2,多尺度退化特征提取:将步骤1得到的三个通道分别输入到三个多尺度融合注意力模块中提取不同通道下的水下衰减特征,得到不同通道的特征矩阵WR、WG、WB,且每个特征矩阵的维度均为T;
步骤3,通道堆叠:将步骤2输出的不同通道的特征矩阵WR、WG、WB使用通道堆叠的方式融合为3×T维度的特征图,即在同一个像素坐标(Xi,Yj),i=1,2,3,...,p,j=1,2,3,...,q上进行堆叠,p和q分别表示特征矩阵的行和列的大小,一般情况下p和q的值相等;
步骤4,感兴趣特征区域提取:依据步骤3得到多通道特征图,运用通道注意力(Channel-wise Attention,CA)机制关注目标中感兴趣的区域像素,且不改变特征图的维度;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于电子科技大学,未经电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210040116.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于深度学习的水下图像恢复方法
- 下一篇:一种自然人的数字化映射方法