[发明专利]用位深度可分级性的增强层残差预测对视频数据进行编码和/或解码的方法和设备无效
申请号: | 200680056632.3 | 申请日: | 2006-12-14 |
公开(公告)号: | CN101601299A | 公开(公告)日: | 2009-12-09 |
发明(设计)人: | 武宇文;高永英 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 北京康信知识产权代理有限责任公司 | 代理人: | 余 刚;吴孟秋 |
地址: | 法国*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 分级 增强 层残差 预测 视频 数据 进行 编码 解码 方法 设备 | ||
技术领域
本发明涉及数字视频编码领域。其为新型可分级性(scalability):位深度可分级性提供编码(coding)解决方案。
背景技术
近年来,在诸如科学成像、数字影院、可放映高质量视频的计算机游戏以及专业工作室和家庭影院的相关应用的许多领域,越来越需要较高的位色彩深度,而非传统的8位色彩深度。因此,现有技术的视频编码标准——H.264/AVC——已经包括保真度范围扩展(Fidelity Range Extensions,FRExt),其支持可达14位的样本和可达4:4:4的色度采样(chroma sampling)。当前的SVC基准软件JSVM不支持高位深度。
然而,现有的高级编码解决方案均不支持色彩位深度可分级性。对于具有两个不同解码器的情景,或对位深度具有不同要求的客户,例如对同一原始视频(raw video)要求8位和12位位深度,现有的H.264/AVC解决方案将对12位的原始视频进行编码以产生第一比特流,然后将12位的原始视频转换为8位的原始视频并对8位的副本(counterpart)进行编码以产生第二比特流。如果我们想将视频传送到要求不同位深度的不同客户,我们必须将其传送两次,或者将2个比特流一起放入一张磁盘。压缩率和运算复杂度两者的效率都很低。
欧洲专利申请EP06291041公开了一种可分级解决方案,该方案一次对整个12位原始视频进行编码从而生成一个比特流,该比特流包含H.264/AVC兼容的基本层(BL)和可分级的增强层(EL)。与附加的第二比特流相比上述第一比特流上的全部可分级比特流的开销小。如果H.264/AVC解码器在接收端可用,则仅对BL子比特流(sub-bitstream)解码,且经解码的8位视频可在传统的8位显示装置上观看;如果位深度可分级解码器在接收端可用,则BL子比特流和EL子比特流都可以被解码,从而获得12位视频,且其可在支持8位以上的色彩深度的高质量显示装置上观看。
发明内容
H.264/AVC可分级性扩展SVC也提供其他类型的可分级性,如空间可分级性。在空间可分级性方面,BL和EL中像素的数目是不同的。因此,出现了如何将位深度可分级性与其他可分级性结合的问题,尤其是与空间可分级性结合。本发明提供了该问题的解决方案。
权利要求1公开了一种编码方法,该方法允许位深度可分级性和其他可分级性结合。权利要求5公开了相应的解码方法。
利用编码方法的设备在权利要求10中公开,利用解码方法的设备在权利要求11中公开。
根据本发明,BL信息在两个逻辑步骤中增采样,一个步骤是纹理增采样,另一个是位深度增采样。纹理增采样是增加像素数目的过程,而位深度增采样是增加每个像素可具有的值的数目的过程。该值对应于像素的色彩强度。增采样的BL单元被用来预测配置(collocated)的EL单元。编码器由EL视频数据生成残差,且该残差可进一步被编码(通常被熵编码)和传输。要被增采样的BL信息可具有任意粒度,如单像素单元、像素块、宏块(MB)或整个图像。进一步,可以在单个步骤中执行两个逻辑增采样步骤。基本层信息在编码器侧被增采样,在解码器侧也以同样方式被增采样,其中,增采样涉及空间和位深度特征。
而且,可以为帧内编码(intra coded)图像和帧间(inter coded)编码图像执行结合的空间和位深度增采样。
具体地,用于对具有基本层和增强层的视频数据进行编码的方法,其中,基本层像素具有比增强层像素低的位深度和空间分辨率,该方法包括以下步骤:
对基本层信息进行增采样,其中,获得增强层信息的预测形式,增强层信息的预测形式具有比基本层高的色彩分辨率和高的空间分辨率;生成增强层残差,改增强层残差为增强层信息和增强层信息的预测形式之间的差;以及对基本层信息和增强层残差进行编码。
根据本发明的一个方面,解码视频数据的方法包括以下步骤:接收经量化和(如DCT-)变换的增强层信息和基本层信息;
对接收的信息执行逆量化和逆变换;
对经逆量化和逆变换的基本层信息进行增采样,其中,像素的数目和每个像素的值深度增加,且其中,获得预测的增强层信息;以及
从预测的增强层信息和经逆量子和逆变换的增强层信息重构重构的增强层视频信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200680056632.3/2.html,转载请声明来源钻瓜专利网。