[发明专利]基于纹理水平的量化调整有效

专利信息
申请号: 200780012500.5 申请日: 2007-04-09
公开(公告)号: CN101416512A 公开(公告)日: 2009-04-22
发明(设计)人: X·左;C-L·林 申请(专利权)人: 微软公司
主分类号: H04N7/24 分类号: H04N7/24
代理公司: 上海专利商标事务所有限公司 代理人: 顾嘉运
地址: 美国华*** 国省代码: 美国;US
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 纹理 水平 量化 调整
【说明书】:

技术领域

发明涉及用于基于视频中的纹理水平来调整量化的方法。

背景技术

随着DVD的日益流行,经因特网、和数码相机、数字媒体传递音乐也变得愈发平常。工程师使用各种技术在维持质量的同时有效处理数字音频、视频和图像。为了理解这些技术,理解音频、视频和图像信息是如何在计算机内表示和处理是有帮助的。

I.计算机中媒体信息的表示

计算机将媒体信息作为表示该信息的一系列数字来处理。例如,单个数字可以表示图片的每个基本小区域的亮度强度或诸如红色、绿色或蓝色等色彩分量的强度,使得图片的数字表示由这些数字的一个或多个阵列组成。每个这样的数字可以被称为一个样本。对于彩色图像,常规上用一个以上的样本来表示每个基本区域的色彩,且通常使用三个样本。用于一基本区域的这些样本的集合可被称之为像素,其中单词“像素”指的是“图片元素”这一概念的缩写。例如,一个像素可以由代表表示该基本区域所必需的红光、绿光和蓝光强度的三个样本组成。这一像素类型被称为RGB像素。若干因素影响媒体信息的质量,包括样本深度、分辨率和帧速率(用于视频)。

样本深度是指示能够用来表示一样本的数字范围的通常以比特为单位的测得的特性。当用于该样本的可能值越多,质量就越高,因为该数字能够捕捉更精细的强度变化和/或更大的值范围。分辨率通常指的是某一持续时间(对于音频)或空间(对于图像或单独的视频图片)内的样本数。分辨率更高的图像往往比其他图像看上去更明快,并且包含更多可辨别的有用细节。帧速率是视频的时间分辨率的常用术语。较高帧速率的视频往往比其他视频更能模拟自然物体的平滑运动,并且也可以类似地认为其在时间维度上包含更多细节。鉴于所有这些因素,如下表1所示,对高质量的折衷是存储和传输信息的表示样本深度、分辨率和帧速率所需的比特率方面的成本。

表1:用于原始视频的不同质量等级的比特率

尽管有存储和发送高质量视频(诸如HDTV)所需的高比特率,但公司和消费者仍愈发依赖计算机来创建、分发和回放高质量内容。为此,工程师使用压缩(也称为源译码或源编码)来降低数字媒体的比特率。压缩通过将信息转换成较低比特率的形式来降低存储和传送信息的成本。压缩可以是无损的,其中视频质量不受损害,但是比特率的降低受到视频复杂度的限制。或者,压缩可以是有损的,其中视频质量受到损害,但是比特率的降低更显著。解压(也被称为解码)从已压缩形式中重构一种版本的原始信息。“编解码器”是编码器/解码器系统。

一般而言,视频压缩技术包括“帧内”压缩和“帧间”或预测压缩。对于视频帧,帧内压缩技术压缩个别的帧,通常称为I帧或关键帧。帧间压缩技术参考前导和/或后续帧来压缩各帧,且帧间压缩的帧通常被称为预测帧、P帧或B帧。

II.Windows Media Video版本8和9中的帧间和帧内压缩

微软公司的Windows MediaVideo(Windows媒体视频)版本8[“WMV8”]包括视频编码器和视频解码器。WMV8编码器使用帧内和帧间压缩,而WMV8解码器使用帧内和帧间解压。Windows Media Video版本9[“WMV9”]对许多操作使用类似的体系结构。

A.帧内压缩

图1示出了WMV8编码器中关键帧中的样本块105的基于块的帧内压缩100。块是一组样本,例如,8x8的样本排列。WMV8编码器将关键视频帧拆分成8x8的块并向诸如块105等各个块应用8x8的离散余弦变换[“DCT”]110。DCT是将8x8的样本块(空间信息)转换成8x8的DCT系数块115的一类频率变换,该系数块是频率信息。DCT操作本身是无损或接近无损的。然而,与原始样本值相比,DCT系数对于编码器的压缩更高效,因为大多数重要信息集中在低频系数中(常规上,块115的左上角),并且许多高频系数(常规上,块115的右下角)具有零或接近零的值。

编码器然后量化(120)该DCT系数,得到8×8的经量化的DCT系数块125。量化是有损的。由于低频DCT系数往往具有更高的值,因此量化通常导致精度的损失,但是不会完全损失关于系数的信息。另一方面,由于高频DCT系数往往具有零或接近零的值,因此高频系数的量化通常导致连续的零值区域。另外,在某些情况中,高频DCT系数比低频DCT系数更粗略地量化,导致对于高频DCT系数的更大精度/信息损失。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/200780012500.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top