[发明专利]视频压缩方法无效
申请号: | 201210140263.3 | 申请日: | 2004-05-12 |
公开(公告)号: | CN103037214A | 公开(公告)日: | 2013-04-10 |
发明(设计)人: | E·阿米尔斯;J·班克基;S·拉瓦恩韦;Y·许;D·米勒;A·格兰奇;P·威尔金 | 申请(专利权)人: | 谷歌公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 北京戈程知识产权代理有限公司 11314 | 代理人: | 程伟;王锦阳 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频压缩 方法 | ||
本申请是申请号为200480020019.7,申请日为2004年5月12日,发明名称为“视频压缩方法”的中国专利申请的分案申请。
相关申请
本申请要求了于2003年5月12日申请的申请号为60/649,187的美国临时专利申请以及于2003年11月14日申请的申请号为10/713,807的美国专利申请的优先权。
技术领域
本发明涉及视频数据尤其是尽可能地以有效的方式编码、解码、压缩和传输视频数据的方法和系统。
背景技术
数据的传输通常受到带宽和吞吐限制的约束。无法在极短的时间内发送或接收无限的数据。为了使被传输的信息的数量和质量达到最大化,在一些情况下,信息在传输时被压缩或编码并且在接收时被解压缩或解码。
在视频数据的传输中数据压缩是必须的。普通的文本,除非非常庞大,可以被轻易而快捷的传输。然而,视频数据包括色度特征、亮度特征,并且经常包含立体声音频信息。即使是非常短的视频片断也需要大量的数据来定义。这些数据的传输和编码必须尽可能的有效,也就是它必须需要尽可能少的被传输的信息。
视频压缩是数据压缩的通用技术的一个子集,因此一个信号被挤压或压缩成一个很小的数集。这些数字将占用硬盘上较少的空间,或者占用较少的网络传输时间。在这些数字被再次使用之前,会使用一个解压缩的算法将数字串扩展成它们原来的(或者至少是类似的)形态。
为了增加压缩率,或者可用于将被存储或传输的数字串的挤压量,视频压缩利用了信号是数字化的视频的来源这一事实。视频和音频数据的有 效压缩被认为是有损算法,因为它们丢弃或者丢失了部分的原始信息;重建的数字串不能精确地匹配原始信息。这是可接受的,因为我们感受视频和音频时的精确度与数字化处理的清晰度相比较并不完美。当视频信号变得轻微失真时,其仍是可识别的。压缩算法在最小的失真和损失下准确重现原始信号的程度是衡量算法成功的标准。
有一些很好的压缩视频和音频信号的理由,包括技术问题和设备成本。一个最重要的问题是传输数据的成本。随着互联网发展成为21世纪事实上的数据传输平台,诸如录像带、电影和广播的模拟媒介将被基于互联网和互联网相关技术的数字化媒介代替。只要愿意,这个数字化的基础将允许数据在星球上任意两台计算机之间传输。然而,数据能够被发送的速度将依赖于很多因素。在极限情况下,一个多世纪前被铺设的并且用于模拟语音通信的铜缆使用modem(modem代表调制/解调)技术以9600比特/秒的低速率来传输数据。类似的速度被用于在诸如蜂窝的无限网路上承载语音。最近,线缆调制解调器、DSL和卫星技术为家庭用户提供了6位数的数据速率(100,000到1兆比特/秒)。对于高端应用,光纤可以使数据速率达到G比特(十亿比特/秒)以及更高的范围。
对于给定的应用,不管有多大的数据速率,传输数据都要耗费金钱。现在,在互联网上发送一兆字节(八百万比特)的开销无论如何也要从低量时的5分钱,便宜到非常极其高量时的1分钱(这个数字不包括接收端的开销)。因此,将一兆字节的数据从一个地方传送到另一个地方的开销总是要超过一便士的。
在视频数据压缩的领域中已经完成了很多工作。本发明的受让人,纽约克利夫顿公园(最初以Duck公司闻名)的On2技术早就出品了诸如VP3和VP5的编解码器,并且微软公司已经出品了诸如MPEG的编码。现有的视频编解码器的一些特点包括离散余弦变换压缩、熵编码和运动向量的差分编码。早期的编码都使用了参考帧,从而如果一个数据包丢失或被破坏,数据可以通过参考参考帧而恢复。所有这些特点和其中的差异都将在下面进行详细地讨论。
在基于DCT(离散余弦变换)的视频压缩系统中,一个8×8的象素块或者预测误差信号数据被转换成一组64个频率系数(一个DC值和63个AC值),之后被量化和转换成一个标志(token)集。
典型的较高频率的AC系数较少,并且因此在量化后不太可能是非零的(也就是更有可能是零)。因此,在标志化之前,系数经常以升序排列即从最低频率的系数(DC值)开始到最高频率的AC系数结束。这个扫描顺序,有时表示为“之字形顺序”,其有助于在开始处集合非零值并将零值集合到末尾处的游程中,并且这样做促进了更有效的压缩。
然而这种固定的扫描顺序不是最理想的。例如,当编码交错视频材料时,某些高频系数会更加突出。这个事实反映在例如编解码器(例如MPEG2)的现有技术中,其命令在编码交错视频时使用可选择的扫描顺序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于谷歌公司,未经谷歌公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210140263.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:7S大豆抗原蛋白注射液及其制备方法
- 下一篇:固体摄像装置