[发明专利]H.264中P帧模式的快速选择方法有效
申请号: | 200910106556.8 | 申请日: | 2009-04-10 |
公开(公告)号: | CN101527851A | 公开(公告)日: | 2009-09-09 |
发明(设计)人: | 袁春;周欣欣;张坤;钟玉琢 | 申请(专利权)人: | 清华大学深圳研究生院 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32 |
代理公司: | 深圳市汇力通专利商标代理有限公司 | 代理人: | 王锁林 |
地址: | 518055广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 264 模式 快速 选择 方法 | ||
技术领域
本发明涉及H.264中P帧编码时的模式选择方法,特别是一种利用机器学习的方法实现快速的P帧模式选择的方法。
背景技术
随着与网络相关的多媒体应用技术的出现和快速发展,使得多媒体数据需要在多种多样的网络传输介质中进行传输,于是也就对视频压缩标准提出了更高的要求。以H.264为代表的新一代视频压缩标准通过采用大量的新技术实现了更高的数据压缩比和更好的网络传输特性,但是也带来了新的问题,如:视频压缩算法变得更为复杂、对计算资源的要求更高、算法运行时间也更长。这就对H.264算法的广泛运用(尤其是在嵌入式环境中的实时应用)带来了一定的局限性。
在H.264中,模式选择阶段所需的时间占到了整个编码过程的60%-80%。而P帧一般来说又是H.264中数量最多的帧,因此缩短P帧模式选择所需要的时间就能大大降低H.264整个编码过程所需要的时间。目前在国内外已经有一些该方面的研究,出现了一些改进的P帧编码快速算法。但这些算法大多缺少灵活性,只能按照人工设定的一些规则运行,且不能在编码时间和编码质量上都能取得好的效果。
发明内容
本发明的目的是提供一种H.264中P帧模式的快速选择方法,该方法能够使H.264算法在获得较好编码质量的情况下大幅缩短编码所需时间,能够降低H.264算法的复杂度,降低对计算资源的要求。
在H.264标准中,编码的最小单位是宏块。P帧中的每个宏块都有帧间和帧内两类大的模式可以选择,而每类大的模式中都有多种小的候选模式(帧间模式有SKIP、16×16、16×8、8×16和P8×8五种,帧内模式有16×16和4×4两种尺寸13种模式)。把每种模式依次编码一次,通过率失真优化公式来获得最佳模式是一种很耗费时间的方法。
宏块的编码模式和宏块本身所包含的内容有着很大的联系。处于画面背景或是较为平滑部分的宏块通常适合采用大尺寸的模式(如SKIP、16×16、16×8或8×16),而处于高速运动物体内部或是细节较多部分的宏块则适合采用小尺寸的模式(如P8×8、Inter4×4)。
相邻宏块的模式通常具有某些相似性,称为空间相关性。这是因为相邻的宏块往往包含相似的视频内容。比如它们可能同时处于画面的背景中或是同一个物体中。
为了更好地利用宏块间的空间相关性,本发明首先采用大量已经编码完毕的视频作为学习材料进行学习,通过邻近的已经编码完毕的宏块的模式来对当前宏块的模式进行预测。然后按照预测的模式对当前宏块进行编码,随即对编码效果进行评估。如果编码效果良好,则忽略其他候选模式。否则,再按照一定的顺序对其余候选模式进行检测,从中选取最好的模式作为当前宏块的最终模式。本发明的具体技术方案如下:
H.264中P帧模式的快速选择方法,包括以下步骤:
1)用邻块的最终模式通过贝叶斯分类器选出当前宏块的初始候选模式集合;
2)若初始侯选模式集合是大尺寸模式集合,则执行步骤3),若是小尺寸模式集合则转至步骤4);
3)根据邻块的最终率失真开销,选出当前宏块的最佳帧间模式;包括:
3.1根据邻块的最终率失真开销设置阈值T1,检测当前宏块在SKIP模式下的率失真开销并与阈值T1比较,若小于T1,则将SKIP作为最佳帧间模式并转至步骤5),否则执行步骤3.2;
3.2进一步检测当前宏块在16×16、16×8和8×16模式下的率失真开销,若率失真开销最小的模式是16×16或SKIP,则将率失真开销最小的模式作为最佳帧间模式并转至步骤5),否则执行步骤3.3;
3.3进一步检测当前宏块在P8×8模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式,转至步骤5);
4)根据邻块的最终模式,选出当前宏块的最佳帧间模式;包括:
4.1根据邻块的最终模式设置阈值T2,检测当前宏块在P8×8模式下4个8×8子块的编码模式(宏块在进行8×8模式编码时会被分成4个8×8子块,每个8×8子块可以独立地选择自己的模式,每个子块的候选模式有8×8、8×4、4×8和4×4四种),若4个8×8子块中有大于或等于T2个子块的模式不为8×8,则将P8×8作为当前宏块的最佳帧间模式并转至步骤5),否则执行步骤4.2;
4.2进一步检测当前宏块在各个大尺寸模式下的率失真开销,将所有模式中率失真开销最小的模式作为最佳帧间模式;
5)比较帧间模式集在给定邻块模式下的后验概率和帧内模式集在给定邻块模式下的后验概率,若前者大于后者则将所述最佳帧间模式作为当前宏块的最终模式,否则执行步骤6);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳研究生院,未经清华大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200910106556.8/2.html,转载请声明来源钻瓜专利网。