[发明专利]面向全景视频编码的自适应选择全局运动估计方法有效
申请号: | 201010045630.2 | 申请日: | 2010-01-14 |
公开(公告)号: | CN101771878A | 公开(公告)日: | 2010-07-07 |
发明(设计)人: | 覃团发;郑嘉利 | 申请(专利权)人: | 广西大学 |
主分类号: | H04N7/26 | 分类号: | H04N7/26;H04N7/32 |
代理公司: | 广西南宁公平专利事务所有限责任公司 45104 | 代理人: | 王素娥 |
地址: | 530004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向全景视频编码的自适应选择全局运动估计方法,包括以下步骤:(1)把图像划分为若干个子图像块、(2)零运动矢量块判定、(3)多分辨率运动估计、(4)平移运动模型运动参数估计、(5)六参数运动模型运动参数估计和(6)十二参数运动模型运动参数估计和(7)率失真优化自适应选择全局运动估计模型。本发明的优点是:通过率失真优化选择最优全局运动估计模型可较好的描述当前帧摄像机运动流特点,使得运动估计更精确,编码性能更高;同时,针对全景视频运动细节丰富,分辨率较高的特点,本发明取拉格朗日参数为λ=0.85×2QP/3+2QP/6,进一步在压缩码率和图像失真度之间取得较好的均衡。 | ||
搜索关键词: | 面向 全景 视频 编码 自适应 选择 全局 运动 估计 方法 | ||
【主权项】:
1.面向全景视频编码的自适应选择全局运动估计方法,包括以下步骤:(1)把图像划分为若干个子图像块、(2)零运动矢量块判定、(3)多分辨率运动估计、(4)平移运动模型运动参数估计、(5)六参数运动模型运动参数估计和(6)十二参数运动模型运动参数估计,其特征在于:增设了(7)率失真优化自适应选择全局运动估计模型,步骤中:1)把一幅图象划分为若干个子图象块,具体来说,就是把CIF图象划分了3×3个子图象块,把QCIF图象划分了2×2个子图象块,选取每个子图象块的中心区域作为全局运动估计的初始化输入,中心区域的大小是64×64像素,考虑到运动物体通常集中在图象中部,因此,位于图象中心的子图象块不作为初始化输入的候选值;2)使用零运动矢量判别方法来剔除静止区域块,在做块匹配运动估计之前,首先计算当前块和参考帧对应块之间的残差,如果亮度均方差MSE(lum)和色度均方差MSE(chr)同时满足以下条件,则当前块的模式是零矢量运动模式,如下式所示:MSE ( lum ) < max ( 5.0 , QP 2 6 ) ]]>MSE ( chr ) < max ( 5.0 , QP 2 12 ) ]]> 式中,QP为量化步长,如果当前块的亮度均方差MSE(lum)和色度均方差MSE(chr)不同时满足以上条件,则当前块为有效的全局运动估计块,进行块匹配运动估计;3)使用多分辨率运动估计,多分辨率图像的金字塔共三层,从下至上每增加一层,图像分辨率在水平和垂直两个方向上都同时减半,由顶层运动矢量插值得到各层的校正质量,插值方法为在l+1层中,根据初始解搜索校正矢量ul+1,m,n,l+1层的运动矢量为d l + 1 , m , n = d ~ l + 1 , m , n + u + u l + 1 , m , n ]]> 顶层的运动矢量dl,m,n和各层的校正矢量ul+1,m,n由最小化误差函数得到;本方法设计的编码器采用上述这种金字塔式运动估计搜索,搜索范围是14个像素,对8×8块是整像素搜索精度,对16×16块和32×32块是2个像素搜索精度,首先对32×32块进行块匹配,依次下来是对16×16、8×8块进行块匹配,其中,8×8块是否需要进行块匹配取决于在做16×16块运动估计时,块内像素点的平均MSE是否超过MSEspliThr:MSE splitThr = 5 λ 256 + QP 2 12 ]]> 式中,λ=0.85QP2,如果超过MSEspliThr则说明16×16块运动估计没有达到很好的运动估计准确度,需要将当前16×16块分为四个8×8块分别进行块匹配和运动估计;4)平移运动模型运动参数在步骤(3)中计算得到;5)六参数运动模型参数值估计方法采用改进的高斯牛顿迭代法,在本方法中,估算MSE阈值被设为0.1;6)十二参数运动模型运动参数估计过程与步骤5)中六参数运动模型运动参数估计过程相同;7)率失真优化自适应选择全局运动估计模型中,率失真优化模型的拉格朗日乘子法代价函数定义如下:JMODE(Sk,Ik|Q,λMODE)=DREC(Sk,Ik|Q)+λMODE·RREC(Sk,Ik|Q) (1)式中:Ik表示某种编码模式;DREC(Sk,Ik|Q)表示重构恢复图像与原始图像间的失真度;RREC(Sk,Ik|Q)表示对宏块编码后数据及相关参数在码流中所占用的比特数,包括宏块头,运动矢量,运动补偿残差等所有信息编码所用的比特数;Q表示量化参数;λMODE表示拉各朗日参数,针对全景视频里运动流的特点,经过大量实验与对比,本发明公开在全景视频编码中,式(1)中λ按下式确定:λ=0.85×2QP/3+2QP/6 (2)在依次用平移运动模型法、六参数运动模型法和十二参数运动模型法进行全局运动估计补偿,量化编码再解码重构过程中,使用拉各朗日乘子法把源图像和预测图像的失真度DREC以及编码所使用的比特数RREC,公式(2)所示的λ值代入式(1)可分别计算出各运动模型的代价函数值,设Jtranslation代表当前块使用平移运动模型的代价函数值,Jaffine代表当前块使用六参数仿射运动模型的代价函数值,Jquadratic代表当前块使用十二参数二次项运动模型的代价函数值,则三者中代价函数值最小的,被选为最优模式,即min{Jtranslation,Jaffine,Jquadratic}。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201010045630.2/,转载请声明来源钻瓜专利网。