[发明专利]一种帧间编码快速模式选择方法有效
申请号: | 201210454656.1 | 申请日: | 2012-11-13 |
公开(公告)号: | CN102932642A | 公开(公告)日: | 2013-02-13 |
发明(设计)人: | 马思伟;余琴;王诗淇;高文 | 申请(专利权)人: | 北京大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32;H04N7/46 |
代理公司: | 北京市商泰律师事务所 11255 | 代理人: | 毛燕生 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 编码 快速 模式 选择 方法 | ||
技术领域
本发明涉及视频编码技术领域,尤其涉及一种帧间编码快速模式选择方法。
背景技术
H.264和AVS视频编码标准是目前主流的编码标准之一,其编码效率在以往编码标准的基础上提高了一倍以上。但其编码效率的提高很大程度上源于更多灵活有效编码工具的采用和编码模式的增加。这使得编码复杂度相比于以往的视频编码标准也有了很大的增加。因此,在很多对视频编码器速度和性能要求较高的场合,实际的应用对视频编码器的算法优化提出了更高的要求。下面,以AVS为例,介绍视频编码过程并分析其复杂度。
在视频编码过程中,视频按帧/场编码。在AVS中,根据预测方式的不同,视频帧/场被分为I帧、P帧、B帧。视频帧/场中的数据首先被划分为非重叠的16×16像素块,其中每个16×16像素块称为一个宏块(Macroblock),视频编码过程是以宏块(Macroblock)为单位进行,在编码端利用率失真准则,对每个宏块选择最优的编码模式。在视频编码过程中,运动估计(ME:Motion Estimation)的模式决策(MD:Mode Decision)是整个编码过程中复杂度最高的模块。随着视频编码标准的发展,从H.261到AVS,编码模式逐步增加,同时运动估计和模式决策的复杂度也随之增加。
在AVS中,每个编码块有多种可选编码模式。对I帧中的宏块来说,采用了多预测方向的帧内预测技术,每个编码块的亮度最多有5种预测方向,色度最多有4种预测方向,如图1所示。对P帧中的宏块而言,不仅有帧内预测模式还有帧间预测模式。其中,帧内预测模式同I帧中相同,亮度最多有5种预测方向,色度最多有4种预测方向;帧间预测采用多参考帧、多方向、可变块大小的预测技术。P帧中最多可支持2个参考帧的预测,支持前向预测,支持4种不同块大小的预测(如图2所示)。除此之外,P帧中还有一种特殊的帧间模式——Skip模式。对B帧中的宏块而言,在P帧的基础上增加了后向预测和双向预测以及Direct模式。编码模式如此之多,选择最好的编码模式是提高编码效率的关键。
宏块的编码流程如图3所示。首先计算出宏块在各种不同模式下的估计值。对帧内预测,只需利用周围像素即可估计出当前块的像素值;对于帧间预测,则需要在参考帧的中,在一定的搜索范围内搜索得到当前块的最优匹配块。这个过程包括:挑选出最优参考帧、最优预测方向和最优运动向量。然后对运动估计得到的残差系数进行变换、量化、熵编码得到其编码码率R,对前面量化后的系数进行反量化、反变换、重构得到重构值,原始像素值减去重构值得到编码失真D。其中码率R的大小对应于熵编码后比特数的大小,R越小说明压缩率越高,而失真D的大小对应于编码后重建数据和原始数据的差别大小,失真越小说明编码后的视频质量越高。在模式决策过程中,编码器需要对每种模式的R和D进行权衡,以选择最佳的编码模式来编码当前宏块。
实际上,不论对于运动估计过程中最优参考帧、预测方向、运动向量的选择还是模式决策过程中编码模式的选择,AVS视频编码器都采用率失真优化技术(Rate Distortion Optimization)。对最优运动向量的选择,在搜索过程中,选择使式(1)中率失真代价J最小的块作为最优匹配块,与最优匹配块的相对位移作为最优运动向量mv。
J=D(s,c(mv))+λMOTIONR(pmv,mv) (1)
其中,s为当前图像中编码块的像素值,c(mv)为编码块的预测像素值,D(s,c(mv))为当前图像编码块与编码块的预测值之间的绝对误差和(SAD),λMOTION为拉格朗日乘数,pmv为预测的运动向量,R(pmv,mv)为编码运动向量所需要的比特数。在参考帧的选择过程中,选择使式(2)中率失真代价J最小的参考帧作为最优参考帧。
J=D(s,c(REF,mv(REF)))+λMOTION(R(mv(REF),pmv(REF))+R(REF)) (2)
其中,s为当前图像中编码块的像素值;REF为参考帧号;c(REF,mv(REF))为当前编码图像块的预测值,即参考帧REF中与当前图像编码块相对位移为mv的块;D(s,c(REF,mv(REF)))为当前图像编码块与其预测值的绝对误差和;R(mv(REF),pmv(REF))为编码运动向量所需的比特数;R(REF)为编码参考帧号所需的比特数。对于编码模式的选择,按式(3)计算各编码模式的率失真代价J,选择使J最小的编码模式作为最优编码模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210454656.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种箱包万向轮
- 下一篇:举升臂折叠式卧式液压千斤顶