[发明专利]用于视频帧内编码的KLT矩阵训练方法无效
申请号: | 200910060558.8 | 申请日: | 2009-01-16 |
公开(公告)号: | CN101489134A | 公开(公告)日: | 2009-07-22 |
发明(设计)人: | 余胜生;高毅;陈加忠;郭红星;孙伟平;陈小平;黎单 | 申请(专利权)人: | 华中科技大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32 |
代理公司: | 华中科技大学专利中心 | 代理人: | 曹葆青 |
地址: | 430074湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 视频 编码 klt 矩阵 训练 方法 | ||
技术领域
本发明涉及信号处理中的视频编码技术领域,特别是针对帧内预测的残差信号训练出具有良好变换性能的KLT矩阵。
背景技术
H.264/AVC是ITU-T的视频编码专家和ISO/IEC的运动图像专家组联合提出的最新视频编码标准。同以往编码标准(如H.261,H.263,MPEG-1,MPEG-2,MPEG-4等)一样,H.264/AVC也采用混合编码框架,在进行编码时,首先将视频图像划分成多个宏块,然后以宏块为单位进行预测、变换以及熵编码。
预测包括帧内预测和帧间预测。帧内预测可以消除视频序列空间上的相关性,而帧间预测可以消除视频序列时间上的相关性。预测完毕,残差数据仍然存在空间冗余,必须进行变换以消除数据中的相关性,使得量化后的系数易于进行熵编码,从而提高压缩效率。
H.264/AVC的帧内预测技术是基于空间域的,即根据相邻宏块的像素的重构值来预测当前宏块。H.264/AVC分别定义了两种亮度预测块尺寸(4×4和16×16)和一种色度尺寸(8×8)。其中,对于4×4的预测块共定义了9种预测模式,而对于16×16的亮度块和8×8的色度块则只定义了5种预测模式。4×4的预测块尺寸适合于具有丰富纹理特征的区域,而16×16的预测块尺寸适合光滑的区域。对预测后的残差系数进行4×4的整数DCT变换,变换矩阵定义如下:
对变换系数进行量化,并将Zig-zag扫描后的系数进行熵编码。最优的预测块尺寸和预测模式的选择是根据率失真优化公式进行选择。
DCT的变换性能接近于最优变换,并且变换性能不依赖于信号,因此在视频和图像编码标准中得到广泛应用。不过,由于不同的帧内预测模式的残差信号具有不同的能量分布特征,采用变换矩阵固定的DCT难以获得理想的变换性能。
KLT(Karhunen-Loève transform)是均方差意义下的最优变换。另外,由于KLT的变换矩阵是通过对样本进行训练获得,因此,具有变换矩阵灵活的特点。不过,KLT的变换性能依赖于数据本身。已有研究表明,对于同一类输入信号,最差KLT矩阵和最优KLT矩阵的变换性能差距可以达到3dB以上。因此,现有的数据压缩应用中,编码端都是实时训练KLT矩阵并将其传输到解码端(通过把KLT矩阵写入压缩的数据流或者是独立传输KLT矩阵)。不过,KLT矩阵的训练过程计算复杂度很高,而且需要额外的信息量表示训练出的KLT矩阵,因此,实时训练KLT矩阵的方法难以适合于视频编码这类应用。
发明内容
本发明的目的在于提供一种用于视频帧内编码的KLT矩阵训练方法,避免了实时训练KLT矩阵的巨大计算量,减少了用于表示KLT矩阵的额外比特开销,训练得到的矩阵具有良好的变换性能。
基于视频帧内编码的KLT矩阵训练方法,分别在各种帧内预测模式下,按照如下方法进行矩阵训练:
(1)提取帧内预测模式P的残差样本频谱;
(2)对残差样本集进行分组,对分组得到的每一个样本组采用传统KLT矩阵训练方法得到一个M×M维的候选KLT矩阵;
(3)按照如下方法优化各候选KLT矩阵:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910060558.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:隧道混凝土管片钢模液压驱动平移开合装置
- 下一篇:等离子体电流硬件补偿装置