[发明专利]编码装置及其控制方法有效
申请号: | 200810173512.2 | 申请日: | 2008-10-29 |
公开(公告)号: | CN101426135A | 公开(公告)日: | 2009-05-06 |
发明(设计)人: | 中山文贵 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | H04N7/26 | 分类号: | H04N7/26 |
代理公司: | 北京怡丰知识产权代理有限公司 | 代理人: | 任之光;郭召道 |
地址: | 日本东京都*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 编码 装置 及其 控制 方法 | ||
技术领域
本发明涉及编码装置及其控制方法。
背景技术
随着近年来多媒体的发展,提出了各种运动图像压缩编码方法。典型的例子是MPEG-1、2和4,以及H.264。在压缩编码处理中,将包含在运动图像中的原图像(图像)分割为称作块的预定区域,并且对各个分割的块实施运动补偿/预测以及DCT变换处理。对于运动补偿/预测,通过对编码图像数据进行局部解码来获取基准图像。因此,解码处理甚至在编码中也是必需的。
当图像按照MPEG压缩和编码时,代码量通常会根据作为图像本身特征的空间频率特征、场景以及量子化标度值而大幅变化。代码量控制是通过实现具有这样编码特征的编码装置来允许以高图像质量获取解码图像的重要技术。
作为代码量控制算法的一种,通常使用TM5(测试模型5)。TM5代码量控制算法包含下述的三个步骤。在下列三个步骤中控制代码量以在每个GOP(画面组)中确保预定的比特率。
(步骤1)
确定下面将要编码的画面(picture)的目标代码量。通过下式计算作为当前GOP中可用代码量的Rgop:
Rgop=(ni+np+nb)*(bits_rate/picture_rate) ...(1)
其中,ni,np和nb为当前GOP中剩余I、P和B画面的数量,bits_rate为目标比特率,picture_rate为画面率。
基于以下编码结果获取I、P和B画面的复杂度Xi,Xp和Xb:
Xi=Ri*Qi
Xp=Rp*Qp
Xb=Rb*Qb ...(2)
其中,Ri,Rp和Rb为通过对I、P和B画面进行编码而获取的代码量,Qi,Qp和Qb为在I、P和B画面中所有宏模块中的Q标度的平均值。基于等 式(1)和(2),I、P和B画面的目标代码量Ti、Tp和Tb可以由下式获取:
Ti=max{(Rgop/(1+((Np*Xp)/(Xi*Kp))+((Nb*Xb)/(Xi*Kb)))),(bit_rate/(8*picture_rate))}
Tp=max{(Rgop/(Np+(Nb*Kp*Xb)/(Kb*Xp))),(bit_rate/(8*picture_rate))}
Tb=max{(Rgop/(Nb+(Np*Kb*Xp)/(Kp*Xb))),(bit_rate/(8*picture_rate))} ...(3)
其中,Np和Nb为在当前GOP中P和B画面的剩余数量,常数Kp=1.0,Kb=1.4。
(步骤2)
三个虚拟缓冲器分别用于I、P和B画面,以管理通过等式(3)获取的目标代码量和生成代码量的差。反馈各个虚拟缓冲器的数据积累量,并基于该数据积累量为下面将要编码的宏模块设定Q标度参照值,从而使实际生成代码量接近于目标代码量。例如,如果当前画面类型为P画面,则可以通过基于下式的运算处理来获取目标代码量和生成代码量之间的差:
dp,j=dp,0+Bp,j-1-((Tp*(j-1))/MB_cnt) ...(4)
其中,下标j为画面中的宏模块数,dp,0为虚拟缓冲器的初始充满度(initial fullness),Bp,j为到第j个宏模块时的总代码量,MB_cnt为画面中的宏模块的数量。通过下式用dp,j(以下称作“dj”)来获取第j个宏模块中的Q标度参照值:
Qj=(dj*31)/r ...(5)
这里r=2*bits_rate/picture)rate ...(6)
(步骤3)
执行基于编码目标宏模块的空间活动性来最终确定量子化标度以获取满意的视觉特征(即,高解码图像质量)的处理。
ACTj=1+min(vblk1,vblk2,...,vblk8) ...(7)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200810173512.2/2.html,转载请声明来源钻瓜专利网。