[发明专利]基于超分辨率生成对抗网络SRGAN的图像去马赛克方法在审
申请号: | 202210448725.1 | 申请日: | 2022-04-24 |
公开(公告)号: | CN114972073A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 郭羽萱;张学敏;金光;戴小兵 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T5/00 | 分类号: | G06T5/00;G06T3/40;G06N3/04;G06N3/08 |
代理公司: | 北京盛凡佳华专利代理事务所(普通合伙) 11947 | 代理人: | 龚楠 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分辨率 生成 对抗 网络 srgan 图像 马赛克 方法 | ||
1.基于超分辨率生成对抗网络SRGAN的图像去马赛克方法,其特征在于:包括以下步骤:
S1:构建数据集
用VOC2012数据集来训练网络,其中包括16700张用于训练的图像和426张用于验证的图像;所有的训练图像都被随机裁剪成88×88像素大小的斑块;对于测试集,使用柯达和麦克马斯特数据集,柯达数据集由24幅图像组成,每幅图像的分辨率为768×512;麦克马斯特数据集由18张图像组成,每张图像都是从500×500的高分辨率图像中提取的;为了对训练和测试数据进行预处理,使用Bicubic插值对原始高分辨率图像进行2倍的降采样,然后生成 RGGB Bayer模式;
S2:构建超分辨率生成对抗网络SRGAN
生成对抗网络由两部分构成:生成器和判别器;生成器的目的是将4通道压缩的CFA图像转换成3通道输出的全彩图像,对G使用SRGAN模型,包含4个卷积块,16个残差块(ResBlocks)和一个子像素卷积层;
鉴别器网络结构使用卷积层,然后进行批量归一化和LeakyReLU激活(α=0.2),并在整个鉴别器网络中避免最大池,它包含8个卷积层,3×3滤波核的数量不断增加,与VGG网络一样,从64核增加到512核,增加了2倍;每当特征数量增加一倍时,就会使用分层卷积来降低图像分辨率;所得的512个特征图之后是两个密集层和一个最后的sigmoid激活函数,以获得样本分类的概率;
S3:训练超分辨率生成对抗网络SRGAN
将上述构建完成的训练数据集输入进生成对抗网络中,对于训练数据,网络每次随机选取一批图像进行学习,分别对判别器和生成器进行交替训练,训练过程采用随机梯度下降法SGD (Stochastic gradient descent),利用Adam(adaptive moment estimation)优化器进行最优化;
感知损失函数为内容损失和对抗损失的加权和,内容损失由MSE损失和VGG特征损失组成:
S4:测试超分辨率生成对抗网络SRGAN
对于测试数据集,利用与训练数据同样的预处理方法,然后将含有马赛克的测试数据输入生成器中,输出的图像被认为就是去马赛克后的图像,通过计算去马赛克后的输出图像与不含马赛克的原始图像之间的峰值功率信噪比PSNR(Peak Signal to Noise Ratio)来衡量去马赛克效果。
2.根据权利要求1所述的基于超分辨率生成对抗网络SRGAN的图像去马赛克方法,其特征在于:所述的步骤S2中,使用两个具有3×3小核和64个特征图的卷积层,然后是批量规范化层和ParametricReLU[作为激活函数,用两个训练有素的子像素卷积层提高输入图像的分辨率,此外,在子像素层之前引入一个跳过连接来引导输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210448725.1/1.html,转载请声明来源钻瓜专利网。