[发明专利]基于场景切换的码率控制视频压缩方法和装置有效

专利信息
申请号: 201210093887.4 申请日: 2012-04-01
公开(公告)号: CN102630013A 公开(公告)日: 2012-08-08
发明(设计)人: 肖炳珠;魏东亮;郝晔明 申请(专利权)人: 北京捷成世纪科技股份有限公司
主分类号: H04N7/26 分类号: H04N7/26
代理公司: 暂无信息 代理人: 暂无信息
地址: 100191 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 场景 切换 控制 视频压缩 方法 装置
【说明书】:

技术领域

发明属于视频压缩编码技术领域,尤其涉及一种基于场景切换的码率控制视频压缩方法和装置。

背景技术

码率控制技术在带宽受限的多媒体通信系统中具有重要的作用。传统的视频通信码率控制算法,如H.264/AVC编码器中采用的码率控制算法,在将码率资源分配到图像组(GOP)中各帧图像时,仅仅考虑了各帧图像自身的复杂度,而忽视了同GOP中各帧图像之间的相关性,如对含有频繁场景切换的视频序列进行编码时,GOP中某帧图像可能因出现场景切换而与其参考帧之间毫无相关性,如果仍然采用传统的码率控制方法,将导致图像编码资源浪费和编码质量的下降。

由于视频序列中I、P及B帧编码后产生的比特数不一样,为了使输出码流速率与信道速率相匹配,提高信道利用率,一般在编码器和信道之间加一个缓冲区,而缓冲区容量大小与通信时延的要求构成了一对新的矛盾,码率控制的目的就是为了解决这一矛盾。对于编码器来说,一个鲁棒的码率控制算法应该在充分利用带宽资源和保证缓冲区不溢出的前提下,将有限的码率资源进行合理分配,获得尽可能好的编码质量。

当视频序列中出现场景切换时,其编码质量将受到影响,影响程度取决于场景切换帧在其所处GOP中的位置。当场景切换发生在I帧时,由于I帧采用帧内编码模式,场景切换对于I帧本身不会产生任何影响,同时也不会对后续帧的预测编码产生影响;由于B帧为双向预测,只要其前后2个参考帧有1帧与其处于同一场景中(假设序列中没有连续2帧同时发生场景切换),其预测编码的精度仍然能够得到保证,编码质量不会受到很大影响。不同于I帧和B帧,当场景切换发生在P帧,对当前GOP编码质量的影响相当大:首先,由于当前P帧与其参考帧处于不同的场景中,帧间预测编码将完全失效,宏块必须通过RDO(rate-distortion optimiza-tion)模式选择后才采取帧内编码,优化过程极大浪费了编码时间;其次,由于绝大多数宏块采用帧内编码模式,占用了大量的码率资源,使得后续各帧由于码率资源缺乏而编码质量下降,此影响还会延续至后续的GOP。

现实中的视频序列,不可避免存在场景切换。如果编码器不考虑场景切换的影响,就会浪费有限的码率资源,从而导致编码质量下降。目前,针对场景切换提出了很多码率控制算法,其中常用的方法是通过改变GOP的结构和长度来重新分配码率资源。如上文提出的算法中,当检测到场景切换时,当前GOP剩余帧和下一个GOP的所有帧合并为一个GOP,因此,GOP长度要比默认长度N大,最糟的情况下为2N-1。由于GOP过长容易导致缓冲区的溢出,并且导致GOP中后面部分帧的编码性能下降。在上文提出的算法中,采取将过长的GOP拆分成2个新的GOP来解决这个问题,但这样做的后果是导致增加一个I帧,造成码率资源的浪费。

在视频压缩算法中,一般的视频压缩算法都没有提及对场景切换的要求,由于采用了固定长度的图像组(GOP)结构,不能有效地处理视频序列中的场景切换,导致场景切换帧后续各帧编码质量严重下降。现有的X.264视频压缩编码算法对场景切换虽然做了一些检测实现,但是并不是所有的场景切换都能正确的检测,而且对于检查到有场景切换的图像也不是每次都用IDR帧(Instantaneous Decoding Refresh即时解码刷新)来重新编码。

发明内容

鉴于现有技术中存在的缺陷,本发明提供一种基于场景切换的码率控制视频压缩方法,其特征在于包括如下步骤:步骤一、输入视频流;步骤二、在对视频流进行编码之前判断单个图像组(GOP)内是否发生场景切换,如果发生场景切换,则执行步骤三,否则执行步骤四;步骤三、强制用IDR帧来编码,重新计算该图像组GOP内的码率大小,然后执行步骤五;步骤四、对输入的视频流进行正常码率编码,进而转入步骤六;步骤五、根据发生场景切换之后重新计算码率后的图像的每个宏块的信息来修正图像组内每个宏块的编码QP值,然后进行压缩编码;步骤六、根据编码压缩输出视频流。

进一步,本发明所述的基于场景切换的码率控制视频压缩方法,其特征在于所述步骤二中判断视频流是否发生场景切换的过程具备包括如下步骤:

步骤1.1,对图像组内连续视频图像fn分别作2x2,4x4,8x8网格划分,定义为分割后的子图像,n代表第n幅图像,k代表分割大小,k取1,2,4,8,i代表网格行坐标,j代表网格列坐标;

步骤1.2利用Paul Viola提出的积分图方法对子图像提取8个haar特征,定义表示对应子块的特征向量,每帧图像特征向量总长度为(2×2+4×4+8×8)×8=672;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京捷成世纪科技股份有限公司,未经北京捷成世纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201210093887.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top