[发明专利]基于SIMD重叠变换的数字媒体解码有效
申请号: | 201010555887.2 | 申请日: | 2006-08-03 |
公开(公告)号: | CN102065294A | 公开(公告)日: | 2011-05-18 |
发明(设计)人: | S·斯里尼瓦杉;C·涂;P·肖 | 申请(专利权)人: | 微软公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 陈斌 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 simd 重叠 变换 数字 媒体 解码 | ||
本申请是国际申请日为2006年8月3日、国际申请号为PCT/US2006/030565、中国国家申请日为2006年8月3日、申请号为200680029306.3、发明名称为“基于SIMD重叠变换的数字媒体编码/解码”的专利申请的分案申请。
技术领域
本发明涉及数字媒体解码方法和数字媒体解码器,尤其涉及基于SIMD重叠变换的数字媒体解码。
背景技术
基于块变换的编码
变换编码是在许多音频、图像和视频压缩系统中使用的一种压缩技术。未压缩数字图像和视频通常被表示或捕捉为以二维(2D)网格排列的图像或视频帧中各位置处的图元或色彩的样本。这被称为图像或视频的空间域表示。例如,用于图像的典型格式由被排列为网格的24位彩色图元流构成。每一样本是表示诸如RGB或YIQ等色彩空间内该网格中的一个像素位置处的色彩分量的数字。各种图像和视频系统可使用各种不同的色彩、空间和时间分辨率的采样。类似地,数字音频通常被表示为时间采样的音频信号流。例如,典型的音频格式由在有规律的时间间隔处所取的16位音频信号幅度样本流构成。
未压缩数字音频、图像和视频信号可消耗大量的存储和传输能力。变换编码通过将信号的空间域表示变换成频域(或其它类似的变换域)表示,然后降低该变换域表示的某些一般较不可感知的频率分量的分辨率,减小了数字音频、图像和视频的大小。这一般与降低空间域中的图像或视频或时域中的音频的色彩或空间分辨率相比,产生了较不可感知的数字信号劣化。
更具体而言,图1所示的典型的基于块变换的编解码器100将未压缩的数字图像的像素划分成固定大小的二维块(X1,...Xn),每一块可能与其它块重叠。对每一块应用进行空间-频率分析的线性变换120-121,这将块内彼此隔开的样本转换成一般表示块间隔上相应的频带内的数字信号的强度的一组频率(或变换)系数。作为比较,变换系数可被选择性地量化130(即,诸如通过丢弃系数值的最低有效位或将较高分辨率数字集中的值映射到较低分辨率来降低分辨率),并且还被熵或可变长度编码130成压缩的数据流。在解码时,变换系数进行反变换170-171以便几乎重构原始的色彩/空间采样图像/视频信号(重构块)。
块变换120-121可被定义为对大小为N的向量x的数学运算。最通常的是,该运算是线性乘法,从而产生变换域输出y=Mx,M是变换矩阵。当输入数据是任意长时,它被分段成大小为N的向量,并且向每一段应用块变换。出于数据压缩的目的,选择可逆块变换。换言之,矩阵M是可逆的。在多个维度中(例如,对于图像和视频),块变换通常被实现为可分操作。沿数据的每一维(即,行和列)可分地应用矩阵乘法。
对于压缩,变换系数(向量y的分量)可被选择性地量化(即,诸如通过丢弃系数值的最低有效位或将较高分辨率数字集中的值映射到较低分辨率来降低分辨率),并还可被熵或可变长度编码为压缩的数据流。
在解码器150中解码时,如图1所示,在解码器150侧应用这些操作的反过程(反量化/熵解码160和反块变换170-171)。在重构数据时,将逆矩阵M1(反变换170-171)作为乘数应用于变换域数据。当应用于变换域数据时,反变换几乎重构原始时域或空间域数字媒体。
在许多基于块变换达到编码应用中,变换理想地是可逆的以取决于量化因子同时支持有损和无损压缩两者。如果例如没有量化(一般被表示为量化因子1),则利用可逆变换的编解码器可在解码时精确地再现输入数据。然而,这些应用中的可逆性的要求约束了对用于设计编解码器的变换的选择。
诸如MPEG和Windows Media等许多图像和视频压缩系统利用基于离散余弦变换(DCT)的变换。已知DCT具有得到近乎最优的数据压缩的良好能量压缩特性。在这些压缩系统中,在压缩系统的编码器和解码器两者中的重构环路中采用了反DCT(IDCT)来重构各个图像块。
重叠变换
在上述基于块变换的编码系统中,块变换是连续地应用于输入信号或图像的不重叠相邻块的有限长度(通常是诸如4或8等较短的长度)变换。因此,跨块边界的信号分量不会影响跨边界的块的变换。由于用于数据压缩的高频率分量的量化,对块变换的使用可能会在块边界处引入可察觉到的伪像,即块状现象(blockiness)。块状现象在高度压缩的JPEG图像中是明显的,并且作为图像中的方块或阶梯形而出现。在音频中,块状现象导致周期性的爆音噪声。这些都不是可容许的伪像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201010555887.2/2.html,转载请声明来源钻瓜专利网。