[发明专利]一种基于强化学习的视频图像编码压缩效率提升方法有效
申请号: | 201810291528.7 | 申请日: | 2018-04-03 |
公开(公告)号: | CN110351558B | 公开(公告)日: | 2021-05-25 |
发明(设计)人: | 陈宇;梅元刚;金星;朱政;丁丹丹 | 申请(专利权)人: | 杭州微帧信息科技有限公司 |
主分类号: | H04N19/124 | 分类号: | H04N19/124;H04N19/176;H04N19/70 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310000 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 强化 学习 视频 图像 编码 压缩 效率 提升 方法 | ||
本发明公开了一种基于强化学习的视频图像编码压缩效率提升方法,针对不同图像内容分块最优化关键编码策略参数。创建分别用于预测策略值,和判别策略值好坏的神经网络,即预测网络和判别网络。预测网络作为编码器的前处理模块,输入图像的原始像素值,输出图像各个分块的最优化策略参数,不需要编码器的反馈。编码结果评分是在对整帧视频图像,或者整段视频图像编码完成之后,得到的压缩效率综合评分。整个环节与编码器耦合弱,易于实施,可以与主流视频或图像编码标准结合,有效提升编码压缩效率。本发明在编码时只需要预测网络执行决策过程,速度较快,并且具有较高的鲁棒性。
技术领域
本发明涉及视频编码、图像编码和深度学习,特别是一种基于强化学习的视频图像编码压缩效率提升方法。
背景技术
随着多媒体数字视频应用的不断发展和人们对视频云计算需求的不断提高,原始
视频信源的数据量以使现有传输网络带宽和存储资源无法承受。因而,视频信号的压缩已
成为目前国内外学术研究和工业应用的热点之一。视频压缩,也称视频编码,其目的是消除
视频信号间存在的冗余信息。至今,国内外标准化组织已相继制定了多种不同的视频编码
标准。自H .261视频编码标准以来,主流的视频编码标准均采用“基于块的预测和变换”的混合编码框架,即输入的视频信号经过编码器中预测、变换、量化、扫描、熵编码等编码技术处理后,最后输出比特流,以备传输或存储。经过几十年的发展,视频编码标准中的工具日趋精细和复杂,基于传统混合编码框架要取得压缩效率的显著提升变得愈发困难。
深度神经网络是人工智能的一个重要分支,从20世纪80年代以来,深度神经网络提供的识别和预测能力一直在提高,在图像与视频、语音与语言处理等领域表现尤为出色。深度学习在计算机视觉领域(如分类、识别等)的成功也带动了一些视频图像处理领域的发展,基于深度学习的图像超分辨率、边缘检测技术迅速发展,性能提升非常显著。受深度学习在图像处理领域的巨大优势启发,可以将深度学习引入视频或图像编码框架中以提升编码效率。目前学术界和业界关于深度学习在视频或图像编码中的应用大体有以下几类:一、系统级地改造图像编码框架;二、基于传统的混合编码框架,改造其中的部分模块,比如熵编码、变换、环路滤波、亚像素插值等;三、前处理或后处理;四、视频编码快速算法。其中第一类和第二类技术需要改变现有标准,有望在将来新的标准中予以实施,但对于工业界还比较遥远。第三类技术着重于提升主观质量。第四类技术以牺牲一定压缩效率为代价,着重于加快编码速度。
在现有主流的视频图像编码标准基础上提升压缩效率,与生态兼容,具有更好的现实意义和产业价值。视频图像内容具有极大的多样性,现有主流的视频编码标准提供给编码器设计很大的灵活性,针对不同图像内容通过调节一些编码策略参数,有很大的压缩效率提升空间。比如各个图像分块的量化参数增量(delta QP),或者率失真代价函数中的拉格朗日乘子(lambda)。这些策略参数通过传统的方法很难求解全局最优值。对于拉格朗日乘子,编码器中一般采用经验值,不随着视频图像内容而改变。对于图像各个分块的量化参数增量,当前有几种主流的调优方法。一种是通过主观敏感度来调整,该方法并不解决压缩效率最优化问题,且产生的量化参数增量可以叠加;一种是通过被参考的次数和权重来标记重要性,然而这种方法只考虑了一个方面的重要性,并不能逼近全局最优,而且不能解决帧内图像编码的问题;还有一种方法是在一定范围内遍历各个量化参数(QP)值,找出编码率失真代价最小的量化参数值。然而这种方法没有考虑块与块之间的影响问题,不能在图像或序列级别逼近全局最优,而且在编码过程中遍历各个量化参数具有很高的复杂度。量化参数增量和朗格朗日乘子等关键策略参数,由于每个图像分块都可以具有不同值,且相互影响,无法大规模生成标签来进行训练,因此常规的监督学习方法无法实施。
发明内容
有鉴于此,本发明提出一种使用强化学习调优适配图像分块内容的编码策略参数
的方法。本发明解决了传统方法无法获取全局最优解,以及机器学习方法难以生成标签来
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州微帧信息科技有限公司,未经杭州微帧信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810291528.7/2.html,转载请声明来源钻瓜专利网。
- 上一篇:视频编码中一种快速帧间预测编码方法
- 下一篇:一种图像编码方法及装置