[发明专利]一种可变码率图像压缩方法及系统在审
申请号: | 202211055600.9 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115439567A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 陈震中;王怀睿 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可变 图像 压缩 方法 系统 | ||
本发明针对端到端优化的图像压缩领域,公开了一种可变码率图像压缩方法及系统。首先通过独热编码将码率控制参数λ转换为二进制向量,再通过全连接层根据编码结果自适应地生成多组专家投票权重。与此同时,模型将对应生成与专家权重数量相同的多组卷积核参数,并通过根据专家权重加权求和的方式实现最终动态卷积核的高效生成。最终以上述生成的动态参数卷积核构建变分自编码器。本方法提出的可变码率模型可以有效地根据码率调节参数改变压缩过程中的数据分布变化方向,并且动态参数调节的设计可以有效降低整体变码率压缩框架的运算量,实现在端到端优化的压缩框架中以单个压缩模型控制多种压缩码率。
技术领域
本发明涉及端到端优化图像压缩领域,特别涉及一种可变码率图像压缩方法及系统。
背景技术
图像压缩是信号处理和计算机视觉领域的一项基本技术。图像和视频压缩方法的不断发展促进了包括超高清图像数据流与增强现实等新应用的不断创新。图像压缩,特别是有损图像压缩的目标是保存图像信号的关键视觉信息,同时降低用于对图像进行编码的比特率,以实现高效的传输和存储。
传统的变换图像压缩流程由以下几个基本模块和步骤组成:变换,量化和熵编码。首先,使用压缩变换操作将图像信号转换成紧凑的和不相关的系数,然后,量化通过截断系数向量中较少的信息维数来丢弃最不重要的信息,最后用熵编码对量化后的相关系数进行压缩。然而,传统混合图像编解码器的每个模块对其他模块都有复杂的依赖关系,因此很难对整个编解码器进行联合优化。随着深度学习的快速发展,人工神经网络的潜力被进一步探索,基于学习的图像压缩框架概念也已经形成。端到端优化的压缩方法由于可以联合训练整个框架参数,各个模块性能的提高自然会促进最终目标的实现。然而,目前大部分图像压缩方案的一个模型仅能支持单个码率的压缩,以单个模型进行可变码率压缩的设计方案很少被探索。
如何构建一个有效的可变码率压缩方案,通过码率调节参数控制模型的率失真权衡能力是一个挑战。本方法以拉格朗日乘子λ作为码率调节参数,使用神经网络根据λ的取值自适应确定专家权重,并将权重分配至对应数量的卷积核进行加权求和,最终以动态参数卷积的形式参与到整体数据变换压缩中。配合整体端到端优化框架的损失函数,进而实现通过码率调节参数对整体模型的压缩能力进行调节的可变码率功能。
发明内容
发明目的:目前大部分基于学习的图像压缩方法通过使用拉格朗日乘子方法,最小化码率-失真对(Rate-Distortion)的加权和来优化网络,拉格朗日矩阵中引入的λ乘子被当作一个超参数来训练一个网络,以在压缩图像的速率和质量之间达到理想的平衡。这种优化方法需要训练和部署单独的网络来适应压缩率,即在进行率失真优化时,不同的码率压缩效果只能通过训练对应数量的模型实现,因此在较大范围的码率-失真曲线内这种方案的部署成本相当高。本发明针对当前端到端优化的图像压缩方法的这一部署难点,提供一种可变码率图像压缩框架构建方法.
一种可变码率图像压缩方法,其特征在于,
输入图像或特征至构建的训练好的包含有变分自编码器的压缩模型中;
压缩模型对输入的图像或特征进行压缩优化后输出压缩后的图像或特征;
在上述的方法,变分自编码器的构建包括
通过独热编码将码率控制参数λ转换为二进制向量,再通过全连接层根据编码结果自适应地生成多组专家投票权重。
生成与专家权重数量相同的多组卷积核参数,并通过根据专家权重加权求和的生成动态卷积核。
将生成的动态参数卷积核替代普通卷积核构建变分自编码器。
采用梯度下降方法对变分自编码器中进行训练,使用可变码率训练策略优化变分自编码器。
在上述的方法,压缩模型构建步骤如下,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211055600.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泥浆驱动旋转导向钻井控制系统
- 下一篇:一种水厂滤池精确配水布气装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序