[发明专利]一种基于离散余弦变化的频域注意力机制的图像去雾方法在审
申请号: | 202211223828.4 | 申请日: | 2022-10-09 |
公开(公告)号: | CN115953305A | 公开(公告)日: | 2023-04-11 |
发明(设计)人: | 胡彬;仲凡凡;李跃华;李金航;程实 | 申请(专利权)人: | 南通大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06N3/0464;G06F3/048;G06N3/08 |
代理公司: | 南通一恒专利商标代理事务所(普通合伙) 32553 | 代理人: | 梁金娟 |
地址: | 226000 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 离散 余弦 变化 注意力 机制 图像 方法 | ||
本发明提供一种基于离散余弦变化的频域注意力机制的图像去雾方法,包括以下步骤:S1、构建基于频域的注意力模块;S2、构建基础网络模块;S3、构建去雾网络模型;S4、设计损失函数;S5、利用有雾图像和无雾图像对去雾网络模型进行训练,得到去雾网络模型的模型参数;S6、在去雾网络模型中导入步骤S3训练好的模型参数,输入有雾图像,输出得到无雾图像。设计了一种融入离散余弦变化(DCT)和多层感知机(MLP)的基本网络模块,使得在频域对图像进行建模,获得了更好的图像细节信息。
技术领域
本发明涉及图像的去雾技术,具体涉及一种基于离散余弦变化的频域注意力机制的图像去雾方法。
背景技术
空气中的灰尘、烟雾漂浮颗粒会吸收和散射阳光,导致视频监控中的图像质量下降,影响目标检测、图像分割等计算机视觉任务的性能。因此,图像去雾是一种关键的图像预处理技术,可以通过恢复图像质量,减少雾霾天气对图像质量的干扰。
随着深度学习在计算机视觉领域取得的巨大成功,基于深度学习的图像去雾也逐渐成为主流,但是多数方法采用卷积神经网络。卷积神经网络通过多层结构,从底层的边缘特征开始逐级提取图像特征,可以看做是对频率域的隐式建模。离散余弦变化(discretecosine transform,DCT)通过将空域信号转换到频率域,在图像压缩领域取得了广泛引用。
因此本专利发明了一种基于离散余弦变化的频域注意力机制的图像去雾方法,显式得在频域对图像进行建模,获得了更好的图像细节信息。
发明内容
本发明要解决的技术问题是提供一种基于离散余弦变化的频域注意力机制的图像去雾方法,设计了一种融入离散余弦变化(DCT)和多层感知机(MLP)的基本网络模块,使得在频域对图像进行建模,获得了更好的图像细节信息。
为解决上述技术问题,本发明的实施例提供一种基于离散余弦变化的频域注意力机制的图像去雾方法,包括以下步骤:
S1、构建基于频域的注意力模块;
S2、构建基础网络模块:由若干个残差模块、一个基于频域的注意力模块和一个3×3卷积层组成;
S3、构建去雾网络模型:由一个3×3卷积层、一个降采样层、若干个基本网络模块、一个升采样层和一个3×3卷积层构成;
S4、设计损失函数:由平滑L1损失函数构成;
S5、利用有雾图像和无雾图像对去雾网络模型进行训练,得到去雾网络模型的模型参数;
S6、在去雾网络模型中导入步骤S3训练好的模型参数,输入有雾图像,输出得到无雾图像。
其中,步骤S1中,所述基于频域的注意力模块包含两个3×3卷积层、两个离散余弦变化网络层DCT和包含一个隐藏层的多层感知机MLP,通过Sigmoid激活函数融合而成。
其中,所述离散余弦变化网络层将输入特征fin,利用离散余弦变化将fin转换到频率域,得到N组频率信号分量将这N组频率分量进行乘积,得到输出为:
其中,步骤S2中,所述残差模块由一个3×3卷积层、ReLU激活函数、一个3×3卷积层组成。
其中,去雾网络模型中,降采样层与升采样层之间进行短连接,基本网络模块之间进行短连接。
其中,所述基本网络模块数量设置为奇数,以保证网络模型对称,并通过短连接将低层网络的特征引入高层网络,提高特征表达。
其中,步骤S4中,平滑L1损失函数用来衡量模型预测的好坏,表现预测与实际数据的差距程度,定义如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南通大学,未经南通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211223828.4/2.html,转载请声明来源钻瓜专利网。