[发明专利]使用运动矩阵对视频进行编码和解码的方法和设备有效
申请号: | 201180060313.0 | 申请日: | 2011-10-10 |
公开(公告)号: | CN103404136B | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | A.莫格哈达姆;J.索尔;吕小安 | 申请(专利权)人: | 汤姆逊许可公司 |
主分类号: | H04N19/97 | 分类号: | H04N19/97;H04N19/132;H04N19/517;H04N19/172 |
代理公司: | 北京市柳沈律师事务所11105 | 代理人: | 叶齐峰 |
地址: | 法国伊西*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 运动 矩阵 视频 进行 编码 解码 方法 设备 | ||
相关申请的交叉引用
本申请要求提交于2010年10月14日的美国临时专利申请序列号61/393,186的权益,通过引用其全部内容而并入本文。
技术领域
本原理一般地涉及视频编码和解码,更具体地,涉及使用运动矩阵对视频进行编码和解码的方法和设备。
背景技术
视频编解码器是一种对数字视频实现视频压缩和/或解压缩的设备。在视频质量、呈现视频所需的数据量(也被称为比特率)、编码和解码算法的复杂性、针对数据损失和错误的鲁棒性、便于编辑、随机存取、本领域压缩算法设计的状态、端至端的延迟以及一些其它因素之间存在复杂的平衡。
视频编解码器寻求以数字格式表现基本的模拟数据集。既然是模拟视频信号(分别表示亮度和颜色信息)的设计,在编解码器设计的图像压缩中共同的第一步骤是在YCbCr颜色空间中表示和存储图像。到YCbCr的转换提供了以下两方面的好处:第一,该转换通过提供颜色信号的去相关性提高了压缩率;第二,该转换将亮度信号(感知上更为重要)从色度信号(感知上不那么重要,并且可以以较低的分辨率表示来实现更高效的数据压缩)中分离出去。
解码过程包括在可能的范围内对编码过程中每个阶段进行求逆。不能准确求逆的一个阶段是量化阶段。在那里,执行求逆的最佳近似。该过程的这部分通常被称为“逆量化”或“去量化”,虽然量化本质上是一个不可逆的过程。
传统视频编码方法包括相对于参考中的简单移动和一些残差(residue)对帧进行分解。转到图1,一般地用参考标号100表示传统的编码方法。该编码方法100包括要被编码的帧2(在时刻t2的f2)、(参考)帧1(在时刻t1的f1),以及一些残差。使用帧1的参考(在时刻t1的f1)和该残差对帧2(在时刻t2的f2)进行编码。传统的混合视频编解码器,如国际标准化组织/国际电工委员会(ISO/IEC)运动图像专家组(MPEG-4)第十部分高级视频编码(AVC)标准/国际电信联盟、电信分部(ITU-T)H.264建议(以下简称“MPEG-4AVC标准”)是基于这个原理。对块进行帧内或帧间预测,之后应用典型的变换、量化、熵编码以及潜在的一些滤波过程。
视频编码是一个非常广泛的领域并针对该课题有几十年的研究。已在其上应用了各种技术。最近出现的压缩感知(compressive sensing)也提供了应用于这个问题的另一种工具。例如,在一现有技术的方法中,使用压缩感知作为对数据块进行编码的一种模式。但是,这个方法仍然依赖于传统方案并引入了压缩感知作为该系统的附带方法。
发明内容
本原理解决现有技术中的这些和其它的缺点和不足,本原理关注于使用运动矩阵进行视频编码和解码的方法和设备。
根据本原理的一个方面,提供了一种设备。该设备包括使用运动矩阵对视频序列中的画面进行编码的视频编码器。所述运动矩阵具有低于给定阈值的秩和相对于字典(dictionary)的稀疏表示。所述字典包括一组原子(atom)和基础向量,用于表示该画面和用于允许仅使用该组在相应的解码器处导出该画面。根据该视频序列的一组参考画面形成该字典。
根据本原理的另一个方面,提供了视频编码器中的一种方法。该方法包括使用运动矩阵对视频序列中的画面进行编码。所述运动矩阵具有低于给定阈值的秩和相对于字典的稀疏表示。所述字典包括一组原子和基础向量,用于表示该画面和用于允许仅使用该组在相应的解码器处导出该画面。根据该视频序列的一组参考画面形成该字典。
根据本原理的再一个方面,提供了一种设备。该设备包括使用运动矩阵的近似对视频序列中的画面进行解码的视频解码器。所述运动矩阵的近似具有低于给定阈值的秩和相对于字典的稀疏表示。所述字典包括一组原子和基础向量,用于表示该画面和用于允许仅使用该组在相应的解码器处导出该画面。根据该视频序列的一组参考画面形成该字典。
根据本原理的其它一个方面,提供了视频解码器中的一种方法。该方法包括使用运动矩阵的近似对视频序列中的画面进行解码。所述运动矩阵的近似具有低于给定阈值的秩和相对于字典的稀疏表示。所述字典包括一组原子和基础向量,用于表示该画面和用于允许仅使用该组在视频解码器处导出该画面。根据该视频序列的一组参考画面形成该字典。
结合附图阅读下面对本原理的示例性实施例的详细描述,本原理的这些和其它方面、特征和优点将变得更加明显。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆逊许可公司,未经汤姆逊许可公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201180060313.0/2.html,转载请声明来源钻瓜专利网。