[发明专利]一种可变码率图像压缩方法及系统在审
申请号: | 202211055600.9 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115439567A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 陈震中;王怀睿 | 申请(专利权)人: | 武汉大学 |
主分类号: | G06T9/00 | 分类号: | G06T9/00 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 鲁力 |
地址: | 430072 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 可变 图像 压缩 方法 系统 | ||
1.一种可变码率图像压缩方法,其特征在于,
输入图像或特征至构建的训练好的包含有变分自编码器的压缩模型中;
压缩模型对输入的图像或特征进行压缩优化后输出压缩后的图像或特征。
2.根据权利要求1所述的一种可变码率图像压缩方法,其特征在于,变分自编码器的构建包括
通过独热编码将码率控制参数λ转换为二进制向量,再通过全连接层根据编码结果自适应地生成多组专家投票权重;
生成与专家权重数量相同的多组卷积核参数,并通过根据专家权重加权求和的生成动态卷积核;
将生成的动态参数卷积核替代普通卷积核构建变分自编码器;
采用梯度下降方法对变分自编码器中进行训练,使用可变码率训练策略优化变分自编码器。
3.根据权利要求1所述的一种可变码率图像压缩方法,其特征在于,压缩模型构建步骤如下,
对码率控制参数进行编码,定义编码码率控制参数的取值区间Λ,取Λ={256,512,1024,2048,4096,6048},码率控制参数λ∈Λ;
使用全连接网络预测专家权重,采用神经网络中的全连接层与线性整流激活函数结合作为权重生成工具,通过拉格朗日乘子λ作为码率控制参数生成了一组自适应调节的专家权重用于下一步的数据变分方向引导;
生成多组可学习卷积核参数,采用卷积神经网络对输入特征进行级联式的连续变分,对多组卷积核进行同步的参数更新,将通过步骤2.2生成的权重进行动态分配卷积核;
根据模拟专家权重对卷积核进行加权求和,动态参数化卷积的卷积次数是多卷积操作线性组合的
使用动态卷积重构压缩模型;将动态参数卷积替换掉图像压缩框架中的所有普通卷积,卷积操作均为以码率调节参数为条件的动态卷积,在进行训练引导下即可进行相应的条件变分编解码;
构建可变码率的率失真损失函数。
4.根据权利要求1所述的一种可变码率图像压缩方法,其特征在于,训练时,将梯度下降方法应用于损失函数中,并使用可变码率训练策略进行整体模型的优化,具体时间通过主编码器从输入图像x中获取到潜在表达y,再通过超先验编码器从潜在表达y中获取到超潜在表达z;;
随机选取拉格朗日乘子λ进行动态参数卷积核的生成以及损失函数的构建,使得模型对码率调节参数始终敏感,进而构建可变码率推理的端到端优化图像压缩模型。
5.根据权利要求1所述的变码率图像压缩框架构建方法,其特征在于,所述的对码率控制参数进行编码的具体过程为:
对码率控制参数进行编码以消除数值距离先验;首先定义编码码率控制参数的取值区间Λ;码率控制参数λ∈Λ,编码结果可表示为
λ′=encodeΛ(λ)
其中λ′表示编码结果,encodeΛ(λ)表示在Λ集合内的编码操作;在可变码率模型构建环节,编码可以保证不同码率种类的前提下,以编码后的形式重新组织码率控制参数,避免码率控制参数的数值大小对最终的模型训练产生错误的训练结果。
6.根据权利要求1所述的一种可变码率图像压缩方法,其特征在于,对模拟专家权重预测的具体过程为:选用神经网络层与线激活函数结合作为权重生成工具;在专家权重生成过程中,必须先确定码率控制参数列表的长度lambda_num以及专家权重数量expert_num,权重生成过程可表示为:
其中,wexpert为动态生成的专家权重组合,指使用神经网路将输入大小为lambda_num的特征转换为输出大小为middle_channel的特征,Act(x)即为激活函数,Softmax{X}为归一化指数函数,用于将模块输出标准化使权重求和结果为1;至此,模型已通过拉格朗日乘子λ作为码率控制参数生成了一组自适应调节的专家权重用于下一步的数据变分方向引导。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉大学,未经武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211055600.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种泥浆驱动旋转导向钻井控制系统
- 下一篇:一种水厂滤池精确配水布气装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序