[发明专利]基于运动跳跃模式的视频编解码方法及其编解码器有效
申请号: | 200710180315.9 | 申请日: | 2007-10-15 |
公开(公告)号: | CN101415115A | 公开(公告)日: | 2009-04-22 |
发明(设计)人: | 林四新;杨海涛;常义林;霍俊彦;高山;熊联欢 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 北京同达信恒知识产权代理有限公司 | 代理人: | 黄志华 |
地址: | 518129广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 运动 跳跃 模式 视频 解码 方法 及其 编解码器 | ||
技术领域
本发明涉及视频编解码技术领域,更具体的涉及一种基于运动跳跃模式的视频编解码方法及其编解码器。
背景技术
随着多媒体通信技术的发展,人们不再满足于传统的固定视点视觉以及2D平面视觉,在娱乐、教育、观光和外科医学等许多应用领域中出现了对自由视点视频和3D视频的需求。例如能够由观看者选择视角的自由视点电视(FTV,Free view-point Television),以及为处于不同位置观看者播放不同视角视频的立体视觉电视(3DTV,3 Dimensional Television)。上述应用都要求使用多个摄像机在不同的空间位置上以不同的角度同时获取同一场景的视频信号,并有效的对所获得的一组视频信号进行压缩编码和传输。所获得的这一组视频被称为多视点视频,而对它们进行压缩编码这一过程则被称为多视点视频编码(MVC,Multi-view Video Coding)。显然多视点视频编码技术是实现上述所有自由视点视频类和3D视频类应用的一项关键技术。
在多视点视频编码技术中,可以简单的通过对每一视点视频信号独立的编码传输来实现多视点视频编码,这个过程称之为视频联播。视频联播仅仅利用了每一视点视频信号内部的时间相关性,所得到的数据量随视点数量增加而线性增长,所以导致编码效率较低。当前多视点视频编码技术的研究重点在于如何充分利用不同视点视图之间的相关性,进一步去除不同视点视频中的冗余信息,从而提高多视点视频的编码效率。
为了提高多视点视频的编码效率,目前提出了运动跳跃模式(MSM,Motion Skip Mode)用于多视点间的预测,MSM技术利用相邻视点视图中运动的高度相似性,将相邻视点视图中的运动信息直接用于当前视点视图的编码,这样可以省去编码图像中某些宏块运动信息所需的比特开销,从而提高了MVC的压缩效率。
上述所指的宏块运动信息包括16x16块的宏块划分模式,宏块中每一个8x8象素精度的块分割模式,宏块中每一个8x8块的参考图像索引,以及宏块中每一个4x4块的运动矢量。MSM主要分为两个处理过程:
1)推导全局视差矢量(GDV,Global Disparity Vector);
2)推导参考图像中对应位置的宏块运动信息(MMI,Macro block Motion Information)。
如图1所示,为现有GDV的推导过程示意图,首先将16x16象素的宏块作为基本单元,设定为MVC中的锚定帧,也就是图1中方框内部的编码图像与视点间参考图像间的全局视差矢量GDV,该GDV将被编码传输。可以分别使用锚定帧ImgA与ImgB的全局视差矢量GDVA与GDVB,依据下述公式(1)推导非锚定帧Imgcur的全局视差矢量GDVcur。其中POCA,POCB与POCcur分别为一组多视点视频中与ImgA,ImgB与Imgcur具有相同时间坐标的图像序列号。
公式(1)
在确定当前编码图像Imgcur的全局视差矢量GDVcur之后,可以根据该确定的GDVcur确定Imgcur中每一个宏块MBcur在视点间参考视频图像中的对应宏块MBcor,并使用MBcor的宏块运动信息作为MBcur的宏块运动信息,以此运动信息对宏块MBcur作后续的运动补偿,并在视图内找到对应参考帧的对应宏块作预测处理,得到残差数据,最后计算该宏块MBcur使用该MSM模式的开销RDCostMBcur,MSM。若计算得到的该宏块MBcur的开销RDCostMBcur小于其它宏块的对应模式开销,则MSM被选定为该宏块MBcur的最终模式。
假设当前编码图像有两个视点间参考图像,若其中一个视点间参考图像无法为编码帧中当前宏块MBcur提供有效的宏块运动信息时,则使用另一个视点间参考图像中的宏块运动信息来衡量MSM模式是否为该当前宏块MBcur的最终模式。
如图2所示,为编码图像有两个视点间参考图像时的示意图,位于S1/T2位置的图像B3,首先使用S0/T2位置的图像B2推导当前宏块MBcur的宏块运动信息,若B2中对应宏块使用帧内模式编码,则进而转而使用位于S2/T2位置的图像B2推导当前宏块MBcur的宏块运动信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710180315.9/2.html,转载请声明来源钻瓜专利网。