[发明专利]一种基于强化学习的视频图像编码压缩效率提升方法有效
申请号: | 201810291528.7 | 申请日: | 2018-04-03 |
公开(公告)号: | CN110351558B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 陈宇;梅元刚;金星;朱政;丁丹丹 | 申请(专利权)人: | 杭州微帧信息科技有限公司 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/176;H04N19/70 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 视频 图像 编码 压缩 效率 提升 方法 | ||
1.一种基于强化学习的视频图像编码压缩效率提升方法,其特征在于:包括以下步骤,
步骤1,创建预测网络和判别网络,并完成网络参数初始化,预测网络负责决策图像分块对应的编码策略参数最优值;判别网络负责判别预测网络生成的编码策略参数好坏;
步骤2,输入图像组,由预测网络得到各个图像分块的编码策略参数p;
步骤3,根据各个图像分块的编码策略参数执行编码过程;
步骤4,编码结果评分,在图像组编码完成以后,得到的压缩效率综合评分R;
步骤5,判别网络估分,根据输入图像组以及预测网络得到编码策略参数p得到估分V;
步骤6,强化学习训练迭代,更新预测网络和判别网络参数,并执行迭代过程;
步骤7,编码决策,负责为视频图像编码生成最优化的各个图像分块的编码策略参数,提升编码压缩效率。
2.根据权利要求1所述的基于强化学习的视频图像编码压缩效率提升方法,其特征在于:图像分块对应的编码策略参数,
所述图像分块对应的编码策略参数,指对视频图像压缩效率影响很大,且对不同视频图像内容有适配性的关键策略参数,包含各个图像分块的量化参数增量delta QP,或者率失真代价函数中的拉格朗日乘子lambda,这些策略参数通过传统的方法很难求解全局最优值;
所述图像分块大小可为任意大小,包括16×16 ,64×64,128×128正方形, 或者长方形,Wedge based不规则形状,分块越小,求解过程越复杂,图像分块的概念与具体编码标准无关,并不与具体标准的编码单元、预测单元或者变换单元、分片slice、分段 segments绑定,具体应用的时候可以根据需要制定图像分块大小、形状以及数目,各图像分块得出的编码策略参数可以拆分或者组合,然后应用到具体的标准中。
3.根据权利要求1所述的基于强化学习的视频图像编码压缩效率提升方法,其特征在于:编码结果评分,
所述编码结果评分,是在对整帧视频图像,或者整段视频图像编码完成之后,得到的压缩效率综合评分,包括根据码率和质量评价得到的综合评分;
所述质量评价包括全参考质量评价峰值信噪比PSNR和结构相似性指标SSIM;
所述编码结果评分计算的最小单位为整帧视频图像编码完成以后,不需要编码过程中的额外计算或反馈,不需要对编码器做定制化改动,与编码器解耦,且能够综合反映图像各个分块之间的互相影响。
4.根据权利要求1所述的基于强化学习的视频图像编码压缩效率提升方法,其特征在于:预测网络负责决策图像分块对应的编码策略参数最优值,
所述预测网络为由若干卷积层的级联的卷积神经网络,加上全连接层构成,预测网络输入为一组视频图像帧的原始像素值,输出图像各个分块的编码策略参数p,预测网络的输入为原始像素值,而不是从编码过程中提取的参数,不需要编码器的额外反馈,保持较弱的耦性性,预测网络在实际推断和编码过程中,用作编码器的前置模块,得到预处理参数。
5.根据权利要求1所述的基于强化学习的视频图像编码压缩效率提升方法,其特征在于:判别网络负责判别预测网络生成的预测值好坏,
所述判别网络为由若干卷积层的级联的卷积神经网络,加上全连接层构成,判别网络负责判别预测网络生成的预测值好坏,判别网络仅在训练中使用,推断中不使用,判别网络的输入为预测网络输出的图像各个分块的编码策略参数p,以及对应的图像原始像素值;输出为判别编码策略参数好坏的估分V。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微帧信息科技有限公司,未经杭州微帧信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810291528.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:视频编码中一种快速帧间预测编码方法
- 下一篇:一种图像编码方法及装置