[发明专利]基于感知的帧间图像编码率失真优化方法及系统有效
申请号: | 202211330696.5 | 申请日: | 2022-10-27 |
公开(公告)号: | CN115665415B | 公开(公告)日: | 2023-09-29 |
发明(设计)人: | 蒋先涛;蔡佩华 | 申请(专利权)人: | 华医数字(湖北)医疗技术股份有限公司 |
主分类号: | H04N19/147 | 分类号: | H04N19/147;H04N19/19;H04N19/503;H04N19/61;H04N19/625 |
代理公司: | 湖北武汉永嘉专利代理有限公司 42102 | 代理人: | 许美红 |
地址: | 430000 湖北省武汉市武昌区江盛路17号*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 感知 图像 编码 失真 优化 方法 系统 | ||
本发明公开了一种基于光视觉感知的帧间图像编码率失真优化方法,包括以下步骤:S1、使用均匀离散曲波变换UDCT对同位置的CTU进行分解,得到同一位置六个不同方向的子带;S2、根据六个不同方向的最精细尺度上的子带系数计算时域关联TC和光谱显著性SS;根据六个不同方向的最粗尺度矩阵计算CTU的视觉平稳性PC;S3、根据计算的时域关联TC、光谱显著性SS和视觉平稳性PC对率失真优化RDO的拉格朗日因子λsubgt;pro/subgt;进行调整。本发明利用一组基于人类感知机制的特征来调整拉格朗日量,提高了编码效率。
技术领域
本发明涉及图像处理领域,尤其涉及一种基于感知的帧间图像编码率失真优化方法及系统。
背景技术
视频编码技术的巨大进步是与多媒体通信的巨大发展相对应的。对数据存储和传输带宽容量的日益增长的需求促进了这一进展,以满足电视广播、互联网视频流、消费电子产品等不同服务的普及和大量使用需求的挑战。ISO/IEC运动图像专家组(MPEG)和ITU-T视频编码专家组(VCEG)联合发布了新一代视频编码标准——高效视频编码(H.265/HEVC)。与以前的H.264/AVC相比,它允许将数据压缩比提高一倍,获得类似水平的视频质量。针对该标准提出了各种新的工具,如内部和内部预测模式算法,有效的优化过程,特别是最大编码单元(LCU)的四叉树分解,可以达到64×64的大小。
为了获得更高的编码效率,通常在编码器侧使用率失真优化(RDO)来选择提供最佳率失真(Rate-Distrotion,R-D)权衡的模式。RDO的目标是在一个目标速率下使失真最小化。在实际的视频编码系统中,受编码复杂度,存储限制等的影响通常无法达到率失真性能的极限而只能尽可能的接近。实际编码率失真曲线越靠近理论率失真曲线,则率失真性能越好。因此在视频编码中使用率失真优化的目的就是找到最优的编码参数集合,使得其率失真性能曲线尽可能地靠近理论率失真曲线。
率失真优化作为保证视频编码效率的主要手段,贯穿了H.265/HEVC的编码过程。为了将拥有巨大数据量的视频信息进行有效传输与存储,通常都会对原始视频进行有损压缩,这虽然会使得重建视频与原始视频出现差别,即带来重建失真,但可以有效地降低视频压缩的码率。视频编码追求的目标是用最少的压缩码率获得最小的压缩失真。但其实这是矛盾的,通常对于一个具体的算法,要想获得更小的失真就必须用更多的码率编码视频,反之亦然。所以对于有损视频压缩,需要有效权衡压缩失真与码率关系,以保证视频编码的率失真性能。在视频编码标准发展过程中,率失真优化方法被证明是能够非常有效地权衡视频编码失真及码率的工具。通过率失真优化选择最优的视频编码参数组合。最终达到有效权衡编码失真与码率,提高视频编码率失真性能的目的。
视频编码中使用的具体的率失真优化方法通常有动态规划优化法和拉格朗日优化方法,而拉格朗日优化法又是视频率失真优化中最常见最有力的优化方法。RDO的目标是使目标速率RT下的失真D最小化,可以描述为:min{D}s.t.RRT;利用拉格朗日乘子因子求解上述优化问题,将其转化为无约束形式:min{J},其中J=D+λR;J是率失真代价,λ是拉格朗日因子;通常,λ的值可以通过实验确定,因为它代表R-D曲线的斜率。考虑到比特率的限制,之前的视频压缩方案倾向于提供一个优化的感知质量,以替代减少压缩和原始帧之间的事实失真,但是其编码效率较低。
发明内容
本发明主要目的在于提供一种HEVC率失真优化方法,旨在利用一组基于人类感知机制的特征来调整拉格朗日量,提高编码效率。
本发明所采用的技术方案是:
提供一种基于感知的帧间图像编码率失真优化方法,包括以下步骤:
S1、使用均匀离散曲波变换UDCT对同位置的CTU进行分解,得到同一位置六个不同方向的子带;
S2、根据六个不同方向的最精细尺度上的子带系数计算时域关联TC和光谱显著性SS;根据六个不同方向的最粗尺度矩阵计算CTU的视觉平稳性PC;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华医数字(湖北)医疗技术股份有限公司,未经华医数字(湖北)医疗技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211330696.5/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序