[发明专利]用于分析和经验混合编码失真建模的方法和装置无效
申请号: | 200780032391.3 | 申请日: | 2007-08-21 |
公开(公告)号: | CN101513072A | 公开(公告)日: | 2009-08-19 |
发明(设计)人: | 杨华;吉尔·M·博伊斯 | 申请(专利权)人: | 汤姆森特许公司 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/50 |
代理公司: | 北京市柳沈律师事务所 | 代理人: | 吕晓章 |
地址: | 法国布洛涅*** | 国省代码: | 法国;FR |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 分析 经验 混合 编码 失真 建模 方法 装置 | ||
相关申请的交叉引用
本申请要求于2006年8月30日提交的美国临时申请第60/823,942号的优先权,在此通过引用并入其全部内容。
技术领域
本发明一般地涉及视频编码,并且更具体地,涉及一种用于分析和经验混合编码失真建模的方法和装置。
背景技术
在视频编码中,期望确定怎样最佳地准确估算视频帧的率失真(RD)曲线。当帧的率失真(rate-distortion)特征是已知时,可以最优地将有限的编码资源(通常是编码比特率)分配给不同的帧以便实现最优的整体编码性能。更经常的,将该问题用公式表示为率失真优化的帧层次(frame-level)比特率分配,目的是服从于特定的总比特率和缓冲区的限制而使平均或最大均方差(MSE)源编码失真最小化。因此,是否能够准确地估算帧的率失真特征将严重影响结果的整体的率控制性能。
实际上,现有的视频编码标准规定了用于编码的有限的数目的量化比例。知道应用了每个合理的量化比例之后的帧的结果的率失真数据就可以执行有效的率控制。在我们的讨论中,为了便利,假设用于变换编码的预测残留数据已经是可用的。现在的问题是对于所有的有效Q计算所有的R-Q和D-Q数据,这里“R-Q”表示具有某个Q的结果的编码比特,“D-Q”表示具有某个Q的结果的编码失真,并且“Q”表示量化比例,即,量化步长。请注意,在Q和由视频编码标准和推荐所定义的量化参数(用QP表示)之间存在一对一的映射。例如,在国际标准化组织和国际电工委员会(ISO/IEC)移动图像专家组-4(MPEG-4)第10部分高级视频编码(AVC)标准/国际电信联盟电信部分(ITU-T)H.264推荐(下文中的“MPEG-4AVC标准”)中,QP范围从0到51,并且每个QP对应于某个量化步长或比例Q。为精确地计算 率失真数据,必须借助蛮力(brute force)用所有的Q来穷举性地对帧进行编码。虽然穷举计算给出了最高的准确度,但也造成了令人却步的计算的复杂度,并且由此,实际上提出了多种率失真模型,目的在于用低的或减少的复杂度来准确估算率失真数据。
大多数现有的率失真模型是分析模型。在这些分析模型中,将R或者D表示为关于量化比例Q和残留信号的方差(variance)σ2的显函数。
我们知道原则上编码帧的结果率和失真不仅与量化比例相关而且与源视频信号自身的特征相关。然而,源视频信号的特征是非稳定的。因此,在分析模型中,普遍采取预测残留信号的方差来应对非稳定的视频信号。关于失真建模,在一种现有技术失真估算方法中失真估算可能采用关于Q和σ2的统一函数的简单形式,而在另一方法中,可以经由分段函数更准确地估算D,该分段函数根据Q关于σ的不同相对量值给出了不同的D-Q或D-σ2关系。分析率失真建模的最显著的优点是它的低运算复杂度。仅仅需要首先计算σ2,然后根据所规定的函数能够直接估算R或D。可以简单地在空间域残留信号上进行方差的计算,无需变换和量化操作,并且由此造成非常低的计算复杂度。然而,D-Q分析建模的缺点在于其折中的估算准确度,这主要是因为在率失真估算中仅仅使用方差来完全应对视频信号的非稳定性的影响是不够的。在较新的ρ-域分析RD模型中改正了这一缺点,其中不同于传统的R-Q和D-Q模型,新的模型是基于零量化的系数的百分比(表示为ρ),其与Q一对一映射。请注意,ρ是将Q应用到变换后的残留信号的结果,并且由此,不仅反映了Q的信息而且反映了非稳定源视频信号的信息。ρ-域比其他现有的基于Q的模型获得了更好的建模性能,而在此的代价是由于额外含有了离散余弦变换(DCT)引起的稍微增加的运算复杂度。
分析模型假定RD与Q(或ρ)之间固定的明确的关系。然而,实际上,帧的实际率失真数据呈现操作性的(operational)率失真曲线,其时常根本不是平滑的或者分段平滑的。这种失配可能极大地危害分析模型的估算准确度。为确保高的准确度,同时仍然减少复杂度,提出了经验的方法,其中仅仅对所选择的Q的小的集合进行穷举性编码,并且从已有数据内插剩余Q的率失真数据。虽然经验模型的建模准确度好于分析模型的建模准确度,但它需要多个额外的编码操作,这仍然引起了相当量的额外运算负荷,并且在实时视频流系统中不是总可以被接受的。
还值得注意的是就R建模而言,ρ-域模型已经实现了高的估算准确度,并且进一步改进的范围非常有限。然而就D建模而言,ρ-域模型和现有的基于Q的模型两者都不能呈现与ρ-域R模型的估算性能同样好的估算性能。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于汤姆森特许公司,未经汤姆森特许公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200780032391.3/2.html,转载请声明来源钻瓜专利网。