[发明专利]一种基于深度学习的生成式遥感图像压缩方法有效
申请号: | 202010404524.2 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111683250B | 公开(公告)日: | 2021-03-16 |
发明(设计)人: | 种衍文;翟亮;潘少明 | 申请(专利权)人: | 武汉大学 |
主分类号: | H04N19/42 | 分类号: | H04N19/42;H04N19/44;H04N19/124;H04N19/147;G06N3/04;G06N3/08 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 王琪 |
地址: | 430072 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 生成 遥感 图像 压缩 方法 | ||
1.一种基于深度学习的生成式遥感图像压缩方法,其特征在于,包括如下步骤:
网络模型训练阶段,将训练图像输入到构建的网络模型中进行训练,直到收敛,获得训练好的网络模型,网络模型的处理过程具体包括:
步骤1,图像张量经过编码器网络压缩处理后,得到原图像的1/128规模的隐藏表征张量;
步骤2,将隐藏表征张量输入到量化器网络,经过预量化处理和量化处理得到二进制的码流;
步骤3,量化后的二进制码流输入到解码器得到重建图像,重建图像再输入判别器进行甄别处理,在解码器与判别器有限次博弈后,达到纳什均衡状态,实现图像的失真优化,所述解码器和判别器共同构成生成对抗模型GAN;
所述编码器网络包含通道自适应模块channel-adaptor和下行块downblock,channel-adaptor是一层保留空间维度的卷积层,图像张量(B,C,H,W)经过channel-adaptor空间维度(H,W)不变,通道数变为4×max{8,c},其中,B是批处理数量,C为图像通道,H为图像高度,W为图像宽度,上述式子中c为具体的通道数;编码器网络中包含m个基于densenet构建的downblock模块,每个downblock由密集模块d-denseblock和下采样模块downsample组成;d-denseblock由4个密集单元d-denseunit组成,d-denseblock的输出是其中所有d-denseunit在C维度上的拼接之和;d-denseunit依次由GDN归一化、LeakyRelu激活以及输出C为m的卷积层组成,原图像经过编码器实现c/(m×210)倍率的压缩;
所述解码器和判别器:解码器由m个基于densenet构建的上行块upblock组成;每个upblock由u-denseblock和上采样模块upsample组成;u-denseblock由4个u-denseunit组成,u-denseblock的输出是其中所有denseunit在C维度上的拼接之和;u-denseunit依次由IGDN反归一化、LeakyRelu激活以及输出C为m的卷积层组成;判别器网络基本结构为4个栈式连接卷积层;
网络模型测试阶段,将图像输入到上述训练好的网络模型中,得到压缩后的图像。
2.如权利要求1所述的一种基于深度学习的生成式遥感图像压缩方法,其特征在于:所述量化器网络的具体处理过程如下,
所述量化器网络包括预量化和量化处理模块,预量化处理模块是在瓶颈层bottleneck将码流B*C*H*W映射到C*(B*H*W)中,以KL散度构造的损失函数,学习参数为C的B*H*W维度的类别分布,在注意力机制基础上实现结构的聚簇化;量化处理模块是将预量化之后的特征图feature maps进行{-1,1}二值化处理得到码流。
3.如权利要求1所述的一种基于深度学习的生成式遥感图像压缩方法,其特征在于:预量化模块的处理过程如下,
将编码器网络输出的隐藏表征张量ze(x)映射到隐藏的嵌入空间e∈Rk×d中,d为嵌入空间向量ej∈Rd的维度,k是向量ej∈Rd类别数量,ze(x)遵循参数为k的后验类别分布q(z=k|x),以如下方式独热编码:
ze(x)经过网络学习,向最近邻嵌入空间e映射,在Rk×d空间中实现离散化归并表示,如下公式所示:
zq(x)=ek,where k=argminj‖ze(x)-ej‖2
ek表示嵌入空间e中的向量。
4.如权利要求1所述的一种基于深度学习的生成式遥感图像压缩方法,其特征在于:网络模型训练使用的损失函数如下,
L=(1-MSSSIM)+MSE+0.01×PSNR+Pro_Q_diff+GAN_loss
MSSSIM表示图像多尺度结构相似度,MSE为均方误差,PSNR为图像信号峰值信噪比,MSSSIM,MSE,PSNR三者作为编码器网络的损失,Pro_Q_diff为预量化模块损失,GAN_loss为生成对抗损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010404524.2/1.html,转载请声明来源钻瓜专利网。