[发明专利]一种基于改进U-Net模型的去图像运动模糊方法有效
申请号: | 202210183370.8 | 申请日: | 2022-02-28 |
公开(公告)号: | CN114549361B | 公开(公告)日: | 2023-06-30 |
发明(设计)人: | 廉佐政;王海珍;崔连和;张光妲;朱文龙;刘佳 | 申请(专利权)人: | 齐齐哈尔大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T5/10;G06T5/20;G06N3/0464;G06N3/048;G06N3/0455;G06N3/08 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 蔡浩 |
地址: | 161006 黑龙江*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 net 模型 图像 运动 模糊 方法 | ||
1.一种基于改进U-Net模型的去图像运动模糊方法,其特征在于:所述改进U-Net模型的网络中的卷积核为3×3,激活函数为Leaky ReLU;其编码器通过以下4个阶段操作实现图像的信息提取:第一阶段用一个32通道深度可分离卷积和三个32通道深度可分离残差卷积;第二阶段用哈尔小波变换、一个64通道深度可分离卷积和三个64通道深度可分离残差卷积;第三阶段用哈尔小波变换、一个128通道深度可分离卷积和三个128通道深度可分离残差卷积;第四阶段用哈尔小波变换、一个256通道深度可分离卷积和两个256通道深度可分离残差卷积,以及密集多接受域通道模块;其解码器通过以下4个阶段的操作实现图像的信息处理:第一阶段用两个256通道深度可分离残差卷积和一个512通道深度可分离卷积,以及哈尔小波逆变换;第二阶段与编码器第三阶段的输出通过跳跃连接进行特征融合,用了三个128通道深度可分离残差卷积和一个256通道深度可分离卷积,以及小波逆变换;第三阶段与编码器第二阶段的输出通过跳跃连接进行特征融合,用了三个64通道深度可分离残差卷积和一个128通道深度可分离卷积,以及小波逆变换;第四阶段层与编码器第一阶段的输出通过跳跃连接进行特征融合,用了三个32通道深度可分离残差卷积和一个3通道深度可分离卷积,将特征图恢复到原始分辨率,最后在于输入数据进行融合后,得到恢复结果。
2.如权利要求1所述的一种基于改进U-Net模型的去图像运动模糊方法,其特征在于:所述的深度可分离卷积由逐通道卷积和逐点卷积组成,逐通道卷积用于将上一层的多通道特征全部拆分为单个通道的特征图,并将所得的单个通道的特征图分别用3×3卷积核进行卷积,然后重新堆叠到一起;逐点卷积用于将逐通道卷积得到的特征图进行第二次卷积,使用1×1卷积核,将逐通道卷积结果进行融合,并自由改变输出通道数量。
3.如权利要求1所述的一种基于改进U-Net模型的去图像运动模糊方法,其特征在于:所述的深度可分离残差卷积根据残差卷积,采用两个深度可分离卷积,添加跳跃连接,直接把输入x传到输出作为初始结果,训练目标是将残差结果逼近于0。
4.如权利要求1所述的一种基于改进U-Net模型的去图像运动模糊方法,其特征在于:所述的改进U-Net模型采用小波变换对原始图像进行分解,然后采用小波逆变换进行重建,具体的,所述的哈尔小波变换采用二维离散哈尔小波,具体的,设一维高通滤波器用表示,一维低通滤波器用ψ(·)表示,小波变换过程如下:先用对图像的行进行操作、对列下采样,再分别用和ψ(·)对图像的列进行操作、对行下采样,得到IHH和IHL子频信息;然后用ψ(·)对图像的行进行操作、对列下采样,再用ψ(·)和对图像的列进行滤波、水平下采样,得到ILL和ILH子频信息,得到的四个子频信息如式(1)-(4)所示:
式(1)-(4)中,x和y表示图像信息的行和列,IHL表示图像的水平高频、垂直低频信息;IHH表示图像的水平、垂直的高频信息;ILL表示图像的水平、垂直的低频信息;ILH表示图像水平低频、垂直高频信息;
然后,将这些信息经过小波逆变换进行融合,最终重构图像。
5.如权利要求1所述的一种基于改进U-Net模型的去图像运动模糊方法,其特征在于:所述的密集多接受域通道模块由四个多接受域通道块和一个瓶颈层组成,用式(5)表示:
Xout=G{(Hi[x0,x1,...,xi-1]);ε} (5)
式中,[x0,x1,…,xi-1]表示串联0,…,i-1层的混合接受域块所产生的特征图;Hi表示将多个输入张量转化为单个张量;G(·)表示瓶颈层的输出,ε为瓶颈层的超参数,瓶颈层采用的滤波器大小为1×1。
6.如权利要求5所述的一种基于改进U-Net模型的去图像运动模糊方法,其特征在于:多接受域通道块由扩张接受域块和通道注意力模块组合而成,用式(6)-(7)表示:
其中,w是卷积层,上标代表扩张卷积大小,下标为卷积核大小,LK代表Leaky ReLU激活函数,cat代表连接操作,R表示融合特征,为Sigmoid激活函数,FC为全连接层,Out为多接受域通道块的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐齐哈尔大学,未经齐齐哈尔大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210183370.8/1.html,转载请声明来源钻瓜专利网。