[发明专利]基于支持向量机的B帧快速帧间预测宏块模式选择方法无效
申请号: | 201310445721.9 | 申请日: | 2013-09-26 |
公开(公告)号: | CN103533349A | 公开(公告)日: | 2014-01-22 |
发明(设计)人: | 陈皓;胡亚平;陈炯聪;黄曙;余南华;刘玮;刘振国;谢国财;邓应松 | 申请(专利权)人: | 广东电网公司电力科学研究院 |
主分类号: | H04N19/00 | 分类号: | H04N19/00;H04N19/176;H04N19/147;H04N19/577 |
代理公司: | 广州知友专利商标代理有限公司 44104 | 代理人: | 周克佑 |
地址: | 510080 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 支持 向量 快速 预测 模式 选择 方法 | ||
技术领域
本发明涉及一种视频编码方法,具体来说涉及一种基于支持向量机的B帧快速帧间宏块模式选择方法。
背景技术
随着视频技术的不断发展和广泛应用,视频编码技术的标准化活动也得到了较大发展,先后成功制定了一系列满足不同应用场景的编码标准,H.264编码标准是ITU-T的视频编码专家组VCEG和ISO/IEC的活动图像专家组MPEG联合研发的高效视频压缩标准。H.264采用4×4块的整数变换、多参考帧预测、率失真优化、多模式高精度帧间预测、可变宏块尺寸和CABAC等技术,较之前的视频编码标准,H.264在大多数码率下都能提供较高的视频质量且可省略码率,具有更高的压缩比和更好的信道适应性,在视频通信领域得到广泛的应用,但是H.264优越的编码性能是以增加计算复杂度为代价的,因此研究具有高压缩率且低复杂度的编码方法成为视频编码技术领域的热点和重点。
在H.264编码器中,每个编码帧的宏块模式可以分为帧内预测宏块模式和帧间预测宏块模式,其中帧间预测宏块模式又可以分为SKIP、Inter16×16、Inter16×8、Inter8×16、Inter8×8、Inter8×8Frext,其中在Inter8×8的模式中可以进一步分为Inter8×4、Inter4×8以及Inter4×4大小的块模式。帧内预测宏块模式可以分为Intra16×16、Intra8×8和Intra4×4。每种帧间预测宏块模式下,又要遍历多个参考帧和三个搜索方向来寻找最优参考帧,而遍历每个参考帧的时候都需要经过复杂的运动估计过程求取运动矢量,其计算复杂度非常高。
目前已有的对H.264/AVC的低复杂度编码方法研究中,主要集中在三个方面。第一,快速宏块模式选择算法,主要根据宏块模式的时空相关性来来缩小候选模式列表,采用提前中断的策略,避免对无贡献或贡献较少模式的遍历。第二,多参考帧的优化,主要是利用视频的纹理特征或率失真特性,采用一定的判断准则,减少需要搜索的参考帧数目,以节约编码时间。第三,运动估计快速算法,运动估计在整个编码过程中占有大部分编码时间,主要可以采用一定方法调整预测运动矢量及利用运动矢量相关性缩小搜索范围,或者提出新的搜索方法来降低运动估计的复杂度和计算量。
发明内容
本发明的目的在于提供一种基于支持向量机的B帧快速帧间预测宏块模式选择方法,本发明通过引入具有较强推广性和学习能力出色的支持向量机(SVM,Support Vector Machines),通过提取编码信息作为输入特征矢量训练支持向量机分类器模型,对帧间预测宏块模式进行分类,避免全搜索遍历,快速决策宏块模式的选择,以达到降低编码器复杂度的目的。
本发明的目的可通过以下的技术措施来实现:
一种基于支持向量机的B帧快速帧间预测宏块模式选择方法,包括以下步骤:
(1)基于支持向量机(support vector machine,SVM)模型训练SVM分类器,具体步骤如下:
(1-1)特征选择和提取:采用全搜索遍历原始编码方法对各测试序列进行编码,将以下编码信息对应的特征提取出来,其中,全搜索就是按照规定的范围把所有的可能点逐一进行搜索:
(1-1-1)率失真代价:提取每个宏块的跳跃(SKIP)模式、帧内预测宏块模式和帧间预测宏块模式中的Inter16×16模式对应的率失真代价值J,其求取公式如下式(1-1)所示。其中:跳跃(SKIP)模式、帧内预测宏块模式、帧间预测宏块模式均属于H.264视频编码标准中的规定。
J(s,c,MODE|λMODE)=SSD(s,c,MODE|QP)+λMODER(s,c,MODE) (1-1)
式中,J(s,c,MODE|λMODE)表示MODE模式下的率失真代价值,MODE表示当前编码宏块的编码模式,c为采用MODE模式编码后的重构视频信号,s为原始的视频信号,R(s,c,MODE)表示MODE模式下用来编码宏块头信息、运动矢量信息和所有DCT(Discrete Cosine Transform,离散余弦变换)系数的所有编码比特数,SSD(s,c,MODE|QP)为原始的视频信号和重构视频信号之间的平方差值和(SSD,Sum of Square Difference),λMODE为拉格朗日乘子,其计算公式如下所示:
λMODE=0.85×2(QP-12)/3 (1-2)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网公司电力科学研究院,未经广东电网公司电力科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310445721.9/2.html,转载请声明来源钻瓜专利网。