[发明专利]图像和视频解码实现有效
申请号: | 201110441018.1 | 申请日: | 2011-12-26 |
公开(公告)号: | CN102547280A | 公开(公告)日: | 2012-07-04 |
发明(设计)人: | 吴勇军;S.萨赫瓦尼;D.特迪纳 | 申请(专利权)人: | 微软公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/30 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 孙之刚;刘鹏 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 视频 解码 实现 | ||
背景技术
工程师使用压缩(也称为信源编码)以降低数字视频的比特率。压缩通过将信息转换成较低比特率的形式来降低存储和传送视频信息的成本。解压缩(也称为解码)从压缩形式重构原始信息的版本。“编解码器”是编码器/解码器系统。
压缩可以是无损耗的,其中,视频的质量不受损害,但比特率的降低受到输入视频数据的固有可变量(有时称为源熵)的限制。或者,压缩可能是有损的,其中,视频的质量受损害,并且不能完全地恢复所损失的质量,但是可实现的比特率的降低更加显著。常常将有损压缩与无损压缩相结合地使用—有损压缩确定信息的近似,并且无损压缩用来表示该近似。
通常,视频压缩技术包括“图片内(intra-picture)”压缩和“图片间(inter-picture)”压缩。图片内压缩技术参考图片内的信息来压缩图片,图片间压缩技术参考先前和/或随后的一个或多个图片(常常称为参考或锚定图片)来压缩图片。
对于图片内压缩而言,例如,编码器将图片分成8×8的采样块,其中,采样是表示用于图片的小的基本像域(elementary region)的明亮强度(或色彩分量的强度)的数字,并且图片的采样被组织成阵列或平面。编码器对个别的块应用频率变换。频率变换将一块采样转换成一块变换系数。编码器将变换系数量化,这可以导致有损压缩。对于无损压缩而言,编码器对量化变换系数进行熵编码。
图片间压缩技术常常通过利用视频序列中的时间冗余使用运动估计和运动补偿来降低比特率。运动估计是用于估计图片之间的运动的过程。例如,对于采样块或当前图片的其它单元而言,编码器尝试在另一图片中的搜索区域中找到相同大小的匹配,另一图片即参考图片。在搜索区域内,编码器将当前单元与各种候选相比较以便找到作为良好匹配的候选。当编码器已找到精确或“足够接近”的匹配时,编码器将当前与候选单元之间的位置变化参数化为运动数据(诸如运动矢量)。通常,运动补偿是使用运动数据从参考图片重构图片的过程。通常,编码器还计算原始当前单元与其运动补偿预测之间的逐个采样的差以确定残余(residual)(也称为预测残余或误差信号)。编码器然后对该残余应用频率变换,作为结果产生变换系数。编码器将变换系数量化并对量化的变换系数进行熵编码。
如果使用已图片内压缩的图片或运动预测的图片作为用于后续运动补偿的参考图片,则编码器重构该图片。解码器还在解码期间重构图片,并且其使用一些重构图片作为运动补偿中的参考图片。例如,对于图片内压缩的图片的一块采样而言,解码器重构一块量化变换系数。解码器和编码器执行逆量化和逆频率变换以产生原始采样块的重构版本。
或者,对于使用图片间预测编码的块而言,解码器或编码器从用于块的预测残余重构该块。解码器将表示预测残余的熵编码信息解码。解码器/编码器对数据进行逆量化和逆频率变换,得到重构残余。在单独的运动补偿路径中,解码器/编码器使用用于从参考图片的移位的运动矢量信息来计算预测块。解码器/编码器然后将预测块与重构残余组合以形成重构块。
在过去的二十年内,已经采用了各种视频编解码标准,包括H.261、H.262(MPEG-2)和H.263标准及MPEG-1和MPEG-4标准。最近,已经采用H.264标准(有时称为14496-10或AVC标准)和VC-1标准。对于另外的细节,参见各标准的代表性版本。视频编解码标准通常定义用于编码视频比特流的语法的选项,详述在编码和解码中使用特定特征时的用于视频序列的比特流中的参数。在许多情况下,视频编解码标准还提供关于解码器应执行以在解码时实现正确结果的解码操作的细节。然而,操作的等级低级实现细节常常是未指定的,或者解码器能够改变某些实现细节以改善性能,只要仍能实现正确的解码结果。
图像和视频解码是计算密集的。考虑在解码期间执行多少次操作,诸如熵解码和逆频率变换之类的任务可能要求密集的计算。此计算成本在各种场景中可能是有问题的,诸如高质量、高比特率视频(例如,压缩的高清晰度视频)的解码。特别地,根据诸如H.264和VC-1之类更新标准的解码任务可能是计算密集的且消耗显著的存储器资源。
发明内容
总而言之,本详细说明提出了用于改善图像或视频解码中的操作效率的技术和工具。本文所述的一些技术和工具降低了图像或视频解码的计算成本,而不损害解码后图像或视频内容的质量。本文所述的其它技术和工具帮助解码器在可用计算资源之间分配解码任务。用更高效的解码,图像或视频解码器能够加速解码,使用其可用计算资源来解码更高比特率/更高质量的内容,或者将其节省的计算资源用于其它任务。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110441018.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:钻孔深度计量装置
- 下一篇:一种烘烤铝合金型材上彩色涂层的方法和装置
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序